4 votos

¿Cuál es la varianza muestral de la varianza de la muestra y cuál es la distribución teórica de muestreo?

Estoy tratando de trabajar algunas cosas en R y estoy teniendo problemas para entender algunas de las instrucciones.

Me generaron $1000$ muestras de tamaño $5$ a partir de la distribución normal estándar, y he calculado la media de la varianza de la muestra de estos. Ahora quiero saber cuál es la varianza de la muestra de mi muestra de muestra de varianzas. Pero yo no estoy seguro de entender realmente lo que esto significa, ni de cómo implementar esto en R.

Además, se me pide que superponer el histograma yo generados a partir de mi muestra un histograma de los teóricos de la densidad de la distribución de muestreo. ¿Qué significa esto? Es decir, lo que se entiende por el teórico de la densidad de la distribución muestral de la varianza de la muestra.

Sé que todos mis muestras procedentes de normal estándar, donde $\sigma^{2}=1$

y sé que si $X_{N}=X_{1}+...+X_{1000}$$N(0,\frac{\sigma^{2}}{1000})$, está presente en todo lo que se refiere a?

Agradezco cualquier ayuda y consejo. Gracias

2voto

BruceET Puntos 7117

La distribución de la varianza de la muestra $S^2$ está dado por $(n-1)S^2/\sigma^2 \sim \chi^2(n-1)$. Supongo que son pidió a proporcionar una ilustración de esta relación mediante R. tenga en cuenta la siguiente simulación.

 m = 1000;  n = 5;  x = rnorm(m*n)
 DTA = matrix(x, nrow=m)  # each row a sample of size n
 v = apply(DTA, 1, var)   # sample variances of m rows
 hist((n-1)*v, prob=T, col="wheat", ylim=c(0,.2))
   curve(dchisq(x, n-1), lwd=2, col="blue", add=T)
   lines(density((n-1)*v), lwd=2, col="darkgreen")
 mean(v)
 ## 1.003081 
 var(v)
 ## 0.4881987

enter image description here

Esto puede no ser exactamente lo que se le pide, pero se puede apuntar en la dirección correcta. He sobrepuesto una densidad de de la curva en el histograma. No estoy seguro de qué tipo de histograma puedan ser superpuestos.

Probablemente, un mensaje importante aquí es que la correspondiente distribución chi-squared ha df = n-1, no df = n. Usted puede tratar de superponer la densidad de $Chisq(5)$ y te ver que no encaja en el histograma del todo bien.

$Addendum:$ Yo no sé si usted sabe acerca de la densidad de los estimadores, pero para la buena medida, también me superpone una estimador de densidad (suavizada histograma) en verde. Para este particular de la ejecución de la simulación de la curva teórica y la estimador de densidad de acuerdo bastante bien, pero si se ejecuta el programa varias veces obtendrá algunos casos en los que el acuerdo no es tan bueno. (Si utiliza m = 10,000, los resultados serán más estable.)

Por favor, hágamelo saber si usted puede hacer sentido de este a terminar su proyecto. ¿Cuál es la varianza de la $Chisq(4)$? Si usted no sabe, mira el artículo de Wikipedia sobre el "Chi-cuadrado de distribución'.

Adenda al Comentario de @Calidad: Debido a que $(n-1)S^2/\sigma^2 \sim Chisq(4),$ tenemos $V[4S^2] = 2(4)$ o $V(S^2) = 8/16 = 1/2$. También, v en el programa representa a $S^2,$, por lo que no es de extrañar que var(v)devuelve $0.488 \approx 0.5$ dentro de simulación de error. (Debido a variaciones están en un cuadrado de la unidad de escala, el margen de simulación de error es numéricamente mayor para las desviaciones de por medio: Varios ejecuta el programa dio valores entre 0,47 y de 0,59. Uso m=10^6 para un más lento correr con mejor precisión).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X