¿Varianza de la muestra?

Question

¿Varianza de la muestra?

Preguntado el 16 de Octubre, 2011: Cuando se hizo la pregunta
36325 visitas: Cuantas visitas ha tenido la pregunta
5 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

¿Cuál es la varianza de la muestra? En otras palabras, estoy buscando $\mathrm{Var}(S^2)$ .

He empezado por ampliar $\mathrm{Var}(S^2)$ en $E(S^4) - [E(S^2)]^2$

Sé que $[E(S^2)]^2$ es $\sigma$ a la potencia de 4. Y hasta ahí llegué.

Preguntado el 16 de Octubre, 2011 por MathMan

0 votos

Sus expresiones son muy difíciles de leer. Tienes que editar y presentar tu pregunta de una manera mejor.

Comentado el 16 de Octubre, 2011 por P. Sohm

2 votos

Una forma de expresar $Var(S^2)$ se encuentra en la página de Wikipedia de desviación .

Comentado el 16 de Octubre, 2011 por Martin OConnor

0 votos

No muestra cómo lo derivaron.

Comentado el 16 de Octubre, 2011 por MathMan

Mostrar 3 comentarios más

Answer 1

5 Respuestas

Answer 2

132voto

goric Puntos 5230

Aquí hay una derivación general que no asume la normalidad.

Reescribamos la varianza de la muestra $S^2$ como una media de todos los pares de índices: $$S^2={1\over{n\choose 2}}\sum_{\{i,j\}} {1\over2}(X_i-X_j)^2.$$ Desde $\mathbb{E}[(X_i-X_j)^2/2]=\sigma^2$ vemos que $S^2$ es un estimador insesgado para $\sigma^2$ .

La varianza de $S^2$ es el valor esperado de $$\left({1\over{n\choose 2}}\sum_{\{i,j\}} \left[{1\over2}(X_i-X_j)^2-\sigma^2\right]\right)^2.$$

Cuando se expande el cuadrado exterior, hay 3 tipos de términos de productos cruzados $$\left[{1\over2}(X_i-X_j)^2-\sigma^2\right] \left[{1\over2}(X_k-X_\ell)^2-\sigma^2\right]$$ dependiendo del tamaño de la intersección $\{i,j\}\cap\{k,\ell\}$ .

Cuando esta intersección está vacía, los factores son independientes y el producto cruzado esperado es cero.
Hay $n(n-1)(n-2)$ términos en los que $|\{i,j\}\cap\{k,\ell\}|=1$ y cada uno tiene un producto cruzado esperado de $(\mu_4-\sigma^4)/4$ .
Hay ${n\choose 2}$ términos en los que $|\{i,j\}\cap\{k,\ell\}|=2$ y cada uno tiene un producto cruzado esperado de $(\mu_4+\sigma^4)/2$ .

Si se combina todo esto, se ve que $$\mbox{Var}(S^2)={\mu_4\over n}-{\sigma^4\,(n-3)\over n\,(n-1)}.$$ Aquí $\mu_4=\mathbb{E}[(X-\mu)^4]$ es el cuarto momento central de $X$ .

Respondido el 16 de Octubre, 2011 por goric (5230 Puntos )

1 votos

Una pregunta relacionada en stats.SE proporciona una solución diferente, y pide una referencia, su entrada sería apreciada: stats.stackexchange.com/q/29905/2750

Comentado el 6 de Junio, 2012 por Patrick

2 votos

@Abe Lo siento, no tengo referencias ni aportes que valgan la pena. Lo anterior es una solución que me inventé para enseñar a mis alumnos.

Comentado el 6 de Junio, 2012 por Usuario no registrado

2 votos

Gracias, una respuesta a la pregunta de stats.SE resolvió mi confusión: la discrepancia era el uso de la curtosis ( $\mu_4$ el cuarto momento central) frente al exceso de curtosis ( $\kappa = \frac{\mu_4}{\sigma^4} -3$ ); una referencia es Mood Graybill y Boes, 1974, Introducción a la teoría de la estadística

Comentado el 7 de Junio, 2012 por Patrick

Mostrar 13 comentarios más

Answer 3

92voto

goingglacial Puntos 161

Tal vez, esto ayude. Supongamos que las muestras se toman de una distribución normal. Entonces usando el hecho de que $\frac{(n-1)S^2}{\sigma^2}$ es una variable aleatoria chi-cuadrado con $(n-1)$ grados de libertad, obtenemos $$\begin{align*} \text{Var}~\frac{(n-1)S^2}{\sigma^2} & = \text{Var}~\chi^{2}_{n-1} \\ \frac{(n-1)^2}{\sigma^4}\text{Var}~S^2 & = 2(n-1) \\ \text{Var}~S^2 & = \frac{2(n-1)\sigma^4}{(n-1)^2}\\ & = \frac{2\sigma^4}{(n-1)}, \end{align*}$$

donde hemos utilizado el hecho de que $\text{Var}~\chi^{2}_{n-1}=2(n-1)$ .

Espero que esto ayude.

Respondido el 16 de Octubre, 2011 por goingglacial (161 Puntos )

24 votos

Recuerda que $(n-1)S^2/\sigma^2$ sólo se garantiza que sea $\chi^2$ cuando la muestra se toma de una distribución normal, sin embargo.

Comentado el 16 de Octubre, 2011 por Martin OConnor

0 votos

Gracias Mike. He editado mi respuesta para reflejar lo que dijiste en tu comentario.

Comentado el 16 de Octubre, 2011 por goingglacial

14 votos

La pregunta planteada es general, mientras que la respuesta es específica para la distribución. Me temo que no es apropiado.

Comentado el 26 de Abril, 2013 por Will Green

Mostrar 8 comentarios más

Answer 4

9voto

Will Green Puntos 758

Puede haber cierta confusión en la definición de la varianza de la muestra ... 1/n frente a 1/(n-1). Supongo que la OP está utilizando la varianza de la muestra con 1/(n-1)... es decir, el estimador insesgado de la varianza de la población, también conocido como el segundo estadístico h:

h2 = HStatistic[2][[2]]

Este tipo de problemas puede resolverse ahora por ordenador. Aquí está la solución utilizando el complemento mathStatica de Mathematica. En particular, buscamos el Var[h2], donde la varianza es sólo el 2º momento central, y expresamos la respuesta en términos de momentos centrales de la población:

CentralMomentToCentral[2, h2]

Podríamos encontrar tan fácilmente, digamos, el 4º momento central de la varianza de la muestra, como:

CentralMomentToCentral[4, h2]

Respondido el 26 de Abril, 2013 por Will Green (758 Puntos )

0 votos

¿Su programa también le permite manejar variables aleatorias dependientes? Presumiblemente, entonces el resultado sería en términos de covarianzas de orden superior.

Comentado el 15 de Agosto, 2019 por Dave Haynes

0 votos

Sí, también funciona para las variables aleatorias dependientes. Hay un ejemplo multivariante en: math.stackexchange.com/questions/589865/

Comentado el 16 de Agosto, 2019 por Will Green

Answer 5

9voto

Ben Puntos 236

Se trata de un resultado muy conocido en estadística, y se puede encontrar en varios libros y artículos sobre teoría del muestreo. Puede encontrar una serie de resultados útiles de este tipo en O'Neill (2014) (esta se da en el Resultado 3, p. 284). Consideremos una distribución con media $\mu$ , varianza $\sigma^2$ , asimetría $\gamma$ y la curtosis $\kappa$ (donde todos estos momentos son finitos). $^\dagger$ Tomando la varianza muestral de $n$ El IID extrae de esta distribución y toma la varianza de la muestra $S_n^2$ da:

$$\boxed{\mathbb{V}(S_n^2) = \bigg( \kappa - \frac{n-3}{n-1} \bigg) \frac{\sigma^4}{n}}$$

En el caso especial de que la distribución subyacente sea mesocúrtica (por ejemplo, para una distribución normal) tenemos $\kappa = 3$ y esta expresión se reduce entonces a

$$\mathbb{V}(S_n^2) = \frac{2n}{n-1} \cdot \frac{\sigma^4}{n} = \frac{2 \sigma^4}{n-1}.$$

También le interesará saber que, en general, la varianza y la media de la muestra están correlacionadas. Su covarianza es $\mathbb{Cov}(\bar{X}_n, S_n^2) = \gamma \sigma^3/n$ y su correspondiente coeficiente de correlación es:

$$\begin{align} \mathbb{Corr}(\bar{X}_n, S_n^2) &= \frac{\mathbb{Cov}(\bar{X}_n, S_n^2)}{\mathbb{S}(\bar{X}_n) \cdot \mathbb{S}(S_n^2)} \\[6pt] &= \frac{\gamma \sigma^3}{n} \Bigg/ \frac{\sigma}{\sqrt{n}} \cdot \sqrt{ \Big( \kappa - \frac{n-3}{n-1} \Big) \frac{\sigma^4}{n}} \\[6pt] &= \frac{\gamma \sigma^3}{n} \Bigg/ \frac{\sigma^3}{n} \cdot \sqrt{\kappa - \frac{n-3}{n-1}} \\[6pt] &= \frac{\gamma}{\sqrt{\kappa - (n-3)/(n-1)}}, \\[6pt] \end{align}$$

y como $n \rightarrow \infty$ lo consigues:

$$\mathbb{Corr}(\bar{X}_n, S_n^2) \rightarrow \frac{\gamma}{\sqrt{\kappa - 1}},$$

que es el asimetría ajustada de la distribución subyacente. Puede encontrar más información sobre los momentos de la muestra (incluida la correlación entre ellos) en O'Neill (2014) .

$^\dagger$ En realidad, basta con suponer que la curtosis es finita, y esto implica que todos los momentos de orden inferior son también finitos.

Respondido el 4 de Septiembre, 2021 por Ben (236 Puntos )

Answer 6

6voto

user1858991 Puntos 11

Mostrar la derivación de $E(\left[{1\over2}(X-Y)^2-\sigma^2\right]^2) = (\mu_4+\sigma^4)/2$ del usuario940:

LHS:

$E(\left[{1\over2}(X-Y)^2-\sigma^2\right]^2) = E(\frac{1}{4}(X-Y)^4 - (X-Y)^2 \sigma^2 + \sigma^4) = E(\frac{1}{4}(X-Y)^4) - 2\sigma^2\sigma^2 + \sigma^4 = E(\frac{1}{4}(X-Y)^4) - \sigma^4 = \frac{1}{4}E(X^4 -4X^3Y +6X^2Y^2 -4XY^3 + Y^4) -\sigma^4 = \frac{1}{4}(2E(X^4) -8E(X)E(X^3) +6 E(X^2)(X^2)) - \sigma^4 = \frac{1}{2}(E(X^4)-4E(X)E(X^3) +3 E(X^2)(X^2) - 2\sigma^4)$

Utilizo el hecho de que $E((x-y)^2) = 2\sigma^2$ aquí.

RHS:

$\require{cancel} (\mu_4+\sigma^4)/2 = \frac{1}{2}(E((X-\mu)^4) + \sigma^4) = \frac{1}{2}(E((X-E(X))^4) + \sigma^4) = \frac{1}{2}(E(X^4 -4X^3E(X) + 6X^2E(X)^2 -4XE(X)^3 + E(X)^4) + \sigma^4) = \frac{1}{2}(E(X^4 -4X^3E(X) + 6X^2E(X^2) - 6X^2\sigma^2 -4XE(X)(E(X^2)-\sigma^2) + (E(X^2)-\sigma^2)^2) + \sigma^4) = \frac{1}{2}(E(X^4) -4E(X)^3E(X) + 6E(X)^2E(X^2) - 6E(X)^2\sigma^2 -4E(X)^2(E(X^2)-\sigma^2) + (E(X^2)-\sigma^2)^2 + \sigma^4) = \frac{1}{2}(E(X^4) -4E(X)^3E(X) + 6E(X)^2E(X^2) - \cancel{6E(X)^2\sigma^2} -4E(X^2)E(X^2) +\cancel{4E(X^2)\sigma^2 +4E(X^2)\sigma^2} - 4\sigma^4 + E(X^2)^2-\cancel{2E(X^2)\sigma^2} + \sigma^4 + \sigma^4) = \frac{1}{2}(E(X^4) -4E(X)^3E(X) + 3E(X)^2E(X^2) - 2\sigma^4)$

Utilizo el hecho de que $E(x) = \mu$ y que $E(x)^2 = E(x^2) - \sigma^2$

Ahora LHS = RHS.

Respondido el 10 de Febrero, 2020 por user1858991 (11 Puntos )

¿Varianza de la muestra?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Varianza de la muestra?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: