Consideremos una encuesta de empresas de tamaño $n$ . Esta encuesta incluye, entre otras variables, el salario medio de los trabajadores de la empresa $i$ ( $x_i$ ) y el número de trabajadores de la empresa ( $L_i$ ). Ambas son variables aleatorias.
Quiero estudiar las propiedades del salario medio en esta economía. Este salario medio se define como
$$ \chi = \sum_i \delta_i x_i $$
donde $\delta_i$ es la proporción de trabajadores de la empresa $i$ con respecto a todos los trabajadores de la muestra. Esto es, $\delta_i=\frac{L_i}{\sum_i L_i}$ . Estos pesos suman uno.
En el marco del análisis de esta media ponderada, me interesan dos descomposiciones que me han venido a la mente:
-
Descomposición matemática :
Defina la media aritmética (es decir, no ponderada) como $\bar x$ . Podemos escribir:
$$ \chi = \bar x \left(\frac{\sum_i \delta_i x_i}{\bar x}\right) $$
En palabras, podemos pensar en $\chi$ como una descomposición entre la media aritmética y una medida de "dispersión en torno a esa media". En efecto, si $x_i=c$ (sin dispersión), $\chi = \bar x = c$ . Así que si $\chi$ está por encima o por debajo de $\bar x$ decirnos algo sobre la dispersión de $x_i$ .
-
Descomposición estadística :
Suponiendo que la muestra sea iid el equivalente muestral del momento poblacional $E(\delta_i x_i)$ es
$$\hat E(\delta_i x_i) = \dfrac{\sum_i \delta_i x_i}{n} = \dfrac{\chi}{n}$$
Pero conocemos las propiedades de la covarianza:
$$ E(\delta_i x_i) = E(\delta_i)E(x_i) + cov(\delta_i,x_i) $$
Cuáles son las muestras equivalentes:
$$ \hat E(\delta_i x_i) = \hat E(\delta_i) \hat E(x_i) + \hat{cov}(\delta_i,x_i) $$
Utilizando lo anterior, y observando que $n\hat E(\delta_i)=1$ (debido a la definición de pesos), obtenemos:
$$ \chi \approx \hat E(x_i) + n \ \hat{cov}(\delta_i,x_i) $$
Se trata también de una forma de descomposición de la media y la dispersión, ya que en el caso de que no haya dispersión ( $x_i=x$ ), el término de covarianza es cero.
Las dos anteriores me parecen muy sencillas y casi obvias. Como tales, Imagino que estas descomposiciones ya han sido estudiadas en la literatura . Tal vez tengan un nombre y todo un conjunto de propiedades a su alrededor.
Por lo tanto, lo que quiero es encontrar nuestro acerca de estas descomposiciones. Sin embargo, no encuentro en ninguna parte bibliografía relacionada con ellas. Por lo que puedo deducir, esto no está relacionado con la literatura sobre descomposición media-varianza, descomposición Blinder-Oaxaca, estandarización, etc.
Mis preguntas son: ¿se trata de descomposiciones comunes? ¿Tienen nombre? ¿Puede remitirme a bibliografía donde pueda leer más sobre ellas?