5 votos

Descomposición de una única variable en media y dispersión en torno a la media

Consideremos una encuesta de empresas de tamaño $n$ . Esta encuesta incluye, entre otras variables, el salario medio de los trabajadores de la empresa $i$ ( $x_i$ ) y el número de trabajadores de la empresa ( $L_i$ ). Ambas son variables aleatorias.

Quiero estudiar las propiedades del salario medio en esta economía. Este salario medio se define como

$$ \chi = \sum_i \delta_i x_i $$

donde $\delta_i$ es la proporción de trabajadores de la empresa $i$ con respecto a todos los trabajadores de la muestra. Esto es, $\delta_i=\frac{L_i}{\sum_i L_i}$ . Estos pesos suman uno.

En el marco del análisis de esta media ponderada, me interesan dos descomposiciones que me han venido a la mente:

  1. Descomposición matemática :

    Defina la media aritmética (es decir, no ponderada) como $\bar x$ . Podemos escribir:

    $$ \chi = \bar x \left(\frac{\sum_i \delta_i x_i}{\bar x}\right) $$

    En palabras, podemos pensar en $\chi$ como una descomposición entre la media aritmética y una medida de "dispersión en torno a esa media". En efecto, si $x_i=c$ (sin dispersión), $\chi = \bar x = c$ . Así que si $\chi$ está por encima o por debajo de $\bar x$ decirnos algo sobre la dispersión de $x_i$ .

  2. Descomposición estadística :

    Suponiendo que la muestra sea iid el equivalente muestral del momento poblacional $E(\delta_i x_i)$ es

    $$\hat E(\delta_i x_i) = \dfrac{\sum_i \delta_i x_i}{n} = \dfrac{\chi}{n}$$

    Pero conocemos las propiedades de la covarianza:

    $$ E(\delta_i x_i) = E(\delta_i)E(x_i) + cov(\delta_i,x_i) $$

    Cuáles son las muestras equivalentes:

    $$ \hat E(\delta_i x_i) = \hat E(\delta_i) \hat E(x_i) + \hat{cov}(\delta_i,x_i) $$

    Utilizando lo anterior, y observando que $n\hat E(\delta_i)=1$ (debido a la definición de pesos), obtenemos:

    $$ \chi \approx \hat E(x_i) + n \ \hat{cov}(\delta_i,x_i) $$

    Se trata también de una forma de descomposición de la media y la dispersión, ya que en el caso de que no haya dispersión ( $x_i=x$ ), el término de covarianza es cero.

Las dos anteriores me parecen muy sencillas y casi obvias. Como tales, Imagino que estas descomposiciones ya han sido estudiadas en la literatura . Tal vez tengan un nombre y todo un conjunto de propiedades a su alrededor.

Por lo tanto, lo que quiero es encontrar nuestro acerca de estas descomposiciones. Sin embargo, no encuentro en ninguna parte bibliografía relacionada con ellas. Por lo que puedo deducir, esto no está relacionado con la literatura sobre descomposición media-varianza, descomposición Blinder-Oaxaca, estandarización, etc.

Mis preguntas son: ¿se trata de descomposiciones comunes? ¿Tienen nombre? ¿Puede remitirme a bibliografía donde pueda leer más sobre ellas?

2voto

Aaron Puntos 36

Desde $\delta_i = L_i / \sum_{i=1}^n L_i$ Esto permite reescribir la cantidad de interés directamente en términos de salarios y tamaño de las empresas (voy a añadir un subíndice para la dependencia de $n$ ):

$$\chi_n = \sum_{i=1}^n \delta_i x_i = \frac{\sum_{i=1}^n L_i x_i}{\sum_{i=1}^n L_i}.$$

La estadística $\chi_n$ es el salario medio de los trabajadores en la primera $n$ empresas (donde la media es por trabajador, no por empresa). En cambio, la media no ponderada $\bar{x}_n = \tfrac{1}{n} \sum_{i=1}^n x_i$ es el salario medio-empresa en la primera $n$ empresas. (Este último también puede considerarse el salario medio por trabajador que se produciría si todas las empresas tuvieran el mismo número de trabajadores).

La estadística $\chi_n$ es una función de los salarios medios $w_1, ..., w_n$ y el tamaño de las empresas $L_1, ..., L_n$ . Sus propiedades de muestreo dependen de las propiedades de estas variables subyacentes, y las descripciones de su valor esperado, y otros aspectos estadísticos, estarían determinadas por la distribución subyacente de estos valores.


Descomposición 1 (descomposición multiplicativa): Lo que has deducido en tu primera descomposición es que el salario medio-trabajador al salario medio-empresa utilizando la ecuación multiplicativa:

$$\chi_n = \bar{x}_n \cdot M_n \quad \quad \quad \quad M_n \equiv \frac{\sum_{i=1}^n \delta_i x_i}{\bar{x}_n} = \frac{n \sum_{i=1}^n L_i x_i}{(\sum_{i=1}^n L_i)(\sum_{i=1}^n x_i)}.$$

El factor multiplicador $M_n$ convierte el salario medio de las empresas en salario medio de los trabajadores; es una medida de la distribución de los trabajadores entre las empresas, en relación con el salario de esas empresas. Esta cantidad adquiere un valor alto (mayor que uno) si los trabajadores se concentran en empresas con salarios altos, y un valor bajo (menor que uno) si los trabajadores se concentran en empresas con salarios bajos. En el caso especial de que todas las empresas tengan el mismo tamaño, tenemos $L_1 = \cdots = L_n$ lo que da $M_n = 1$ y $\chi_n = \bar{x}_n$ .

El único uso real de esta descomposición sería si se quiere utilizar el factor multiplicativo como medida de concentración de trabajadores entre empresas con salarios diferentes. Esta estadística podría ser un cuantificador útil de la "concentración" de trabajadores entre empresas con salarios diferentes, si esto es algo de interés. Dado que el multiplicador es más complejo que cualquiera de los promedios individuales (y se deriva de su relación), es poco probable que sea útil más allá de esto. No conozco ninguna literatura en particular sobre esta descomposición, pero podría intentar buscar en la literatura económica que estudia agregados macroeconómicos de salarios y concentración de trabajadores. En cualquier caso, exista o no literatura sobre esta estadística, la interpretación de la misma es suficientemente obvia.


Descomposición 2 (descomposición aditiva): Es difícil dar sentido a tu trabajo aquí, ya que hay mucha confusión de expectativa con promedio, etc. En cualquier caso, la descomposición que buscas se resuelve con el comentario de Martijn Weterings arriba. La covarianza muestral entre los valores $x_i$ y $\delta_i = L_i / \sum_{i=1}^n L_i$ (sin la corrección de Bessel) es:

$$\begin{equation} \begin{aligned} \mathbb{Cov}(\boldsymbol{x}_n, \boldsymbol{\delta}_n) &= \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x}_n) (\delta_i - \bar{\delta}_n) \\[8pt] &= \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x}_n) (\delta_i - \tfrac{1}{n}) \\[8pt] &= \frac{\bar{x}_n}{n} \sum_{i=1}^n (\tfrac{x_i}{\bar{x}_n} - 1) (\delta_i - \tfrac{1}{n}) \\[8pt] &= \frac{\bar{x}_n}{n} \Big( \sum_{i=1}^n \tfrac{x_i \delta_i}{\bar{x}_n} - \tfrac{1}{n} \sum_{i=1}^n \tfrac{x_i}{\bar{x}_n} - \sum_{i=1}^n \delta_i + \sum_{i=1}^n \tfrac{1}{n} \Big) \\[8pt] &= \frac{\bar{x}_n}{n} ( M_n - 1 - 1 + 1 ) \\[8pt] &= \frac{\bar{x}_n}{n} ( M_n - 1 ) \\[8pt] &= \frac{1}{n} ( \chi_n - \bar{x}_n ). \\[8pt] \end{aligned} \end{equation}$$

Por lo tanto, se tiene la descomposición aditiva:

$$\chi_n = \bar{x}_n + n \cdot \mathbb{Cov}(\boldsymbol{x}_n, \boldsymbol{\delta}_n).$$

El término aditivo de esta última descomposición ajusta el salario medio de la empresa al alza o a la baja para obtener el salario medio de los trabajadores; también es una medida de la concentración de trabajadores en empresas con salarios elevados, pero esta vez la medida es relativa al salario medio de la empresa. $\bar{x}_n$ y tiene una escala aditiva. Este término es positivo si $M_n > 1$ y negativo si $M_n < 1$ (y cero si $M_n = 1$ ), y está totalmente determinada por la escala $\bar{x}_n$ y la anterior medida multiplicativa de concentración de trabajadores.

De nuevo, no conozco ninguna bibliografía particular sobre esta descomposición. Es sólo una forma de expresar el salario medio de los trabajadores utilizando una métrica aditiva que representa la concentración de trabajadores en empresas con salarios elevados.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X