La distribución de la varianza de la muestra $S^2$ está dado por
$(n-1)S^2/\sigma^2 \sim \chi^2(n-1)$. Supongo que son
pidió a proporcionar una ilustración de esta relación
mediante R. tenga en cuenta la siguiente simulación.
m = 1000; n = 5; x = rnorm(m*n)
DTA = matrix(x, nrow=m) # each row a sample of size n
v = apply(DTA, 1, var) # sample variances of m rows
hist((n-1)*v, prob=T, col="wheat", ylim=c(0,.2))
curve(dchisq(x, n-1), lwd=2, col="blue", add=T)
lines(density((n-1)*v), lwd=2, col="darkgreen")
mean(v)
## 1.003081
var(v)
## 0.4881987
Esto puede no ser exactamente lo que se le pide, pero se puede
apuntar en la dirección correcta. He sobrepuesto una densidad de
de la curva en el histograma. No estoy seguro de qué tipo de histograma
puedan ser superpuestos.
Probablemente, un mensaje importante aquí es que
la correspondiente distribución chi-squared ha df = n-1, no df = n.
Usted puede tratar de superponer la densidad de $Chisq(5)$ y te
ver que no encaja en el histograma del todo bien.
$Addendum:$ Yo no sé si usted sabe acerca de la densidad de
los estimadores, pero para la buena medida, también me superpone una
estimador de densidad (suavizada histograma) en verde. Para este
particular de la ejecución de la simulación de la curva teórica y la
estimador de densidad de acuerdo bastante bien, pero si se ejecuta el programa
varias veces obtendrá algunos casos en los que el acuerdo
no es tan bueno. (Si utiliza m = 10,000, los resultados serán más
estable.)
Por favor, hágamelo saber si usted puede hacer sentido de este a terminar su proyecto. ¿Cuál es la varianza de la $Chisq(4)$? Si usted no sabe,
mira el artículo de Wikipedia sobre el "Chi-cuadrado de distribución'.
Adenda al Comentario de @Calidad: Debido a que $(n-1)S^2/\sigma^2 \sim Chisq(4),$ tenemos $V[4S^2] = 2(4)$ o $V(S^2) = 8/16 = 1/2$. También, v
en el programa
representa a $S^2,$, por lo que no es de extrañar que var(v)
devuelve
$0.488 \approx 0.5$ dentro de simulación de error. (Debido a variaciones
están en un cuadrado de la unidad de escala, el margen de simulación de error es numéricamente mayor para las desviaciones de por medio: Varios
ejecuta el programa dio valores entre 0,47 y de 0,59. Uso m=10^6
para un más lento correr con mejor precisión).