Respuesta rápida
La razón es que, asumiendo que los datos son i.i.d. y Xi∼N(μ,σ2) y definiendo ˉX=N∑XiNS2=N∑(ˉX−Xi)2N−1 al formar los intervalos de confianza, la distribución muestral asociada a la varianza de la muestra ( S2 (recuerde, ¡una variable aleatoria!) es una distribución chi-cuadrado ( S2(N−1)/σ2∼χ2n−1 ), al igual que la distribución muestral asociada a la media de la muestra es una distribución normal estándar ( (ˉX−μ)√n/σ∼Z(0,1) ) cuando se conoce la varianza, y con una t-student cuando no se conoce ( (ˉX−μ)√n/S∼Tn−1 ).
Respuesta larga
En primer lugar, vamos a demostrar que S2(N−1)/σ2 sigue una distribución chi-cuadrado con N−1 grados de libertad. A continuación, veremos la utilidad de esta prueba a la hora de derivar los intervalos de confianza para la varianza, y cómo aparece la distribución chi-cuadrado (¡y por qué es tan útil!). Comencemos.
La prueba
Para ello, tal vez deba acostumbrarse a la distribución chi-cuadrado en este Artículo de Wikipedia . Esta distribución sólo tiene un parámetro: los grados de libertad, ν y resulta que tiene una función generadora de momentos (MGF) dada por: mχ2ν(t)=(1−2t)−ν/2. Si podemos demostrar que la distribución de S2(N−1)/σ2 tiene una función generadora de momentos como ésta, pero con ν=N−1 entonces hemos demostrado que S2(N−1)/σ2 sigue una distribución chi-cuadrado con N−1 grados de libertad. Para demostrarlo, hay que tener en cuenta dos hechos:
-
Si definimos, Y=∑(Xi−ˉX)2σ2=∑Z2i, donde Zi∼N(0,1) es decir, variables aleatorias normales, la función generadora de momentos de Y viene dada por mY(t)=E[etY]=E[etZ21]×E[etZ22]×...E[etZ2N]=mZ2i(t)×mZ22(t)×...mZ2N(t). El MGF de Z2 viene dada por mZ2(t)=∫∞−∞f(z)exp(tz2)dz=(1−2t)−1/2, donde he utilizado el PDF de la normal estándar, f(z)=e−z2/2/√2π y, por lo tanto, mY(t)=(1−2t)−N/2, que implica que Y sigue una distribución chi-cuadrado con N grados de libertad .
-
Si Y1 y Y2 son independientes y cada una se distribuye como una distribución chi-cuadrado pero con ν1 y ν2 grados de libertad, entonces W=Y1+Y2 se distribuye con una distribución chi-cuadrado con ν1+ν2 grados de libertad (esto se deduce de tomar el MGF de W (¡hazlo!).
Con los datos anteriores, obsérvese que si se multiplica la varianza de la muestra por N−1 se obtiene (tras un poco de álgebra), (N−1)S2=−n(ˉX−μ)+∑(Xi−μ)2, y, por lo tanto, dividiendo por σ2 , (N−1)S2σ2+(ˉX−μ)2σ2/N=∑(Xi−μ)2σ2. Obsérvese que el segundo término del lado izquierdo de esta suma se distribuye como una distribución chi-cuadrado con 1 grado de libertad, y la suma del lado derecho se distribuye como una chi-cuadrado con N grados de libertad. Por lo tanto, S2(N−1)/σ2 se distribuye como un chi-cuadrado con N−1 grados de libertad .
Cálculo del intervalo de confianza para la varianza.
Cuando se busca un intervalo de confianza para la varianza, se desea conocer los límites L1 y L2 en P(L1≤σ2≤L2)=1−α. Juguemos con la desigualdad dentro del paréntesis. Primero, dividamos por S2(N−1) , L1S2(N−1)≤σ2S2(N−1)≤L2S2(N−1). Y luego recuerda dos cosas: (1) la estadística S2(N−1)/σ2 tiene una distribución chi-cuadrado con N−1 grados de libertad y (2) las varianzas son siempre mayores que cero, lo que implica que se pueden invertir las desigualdades, porque L1S2(N−1)≤σ2S2(N−1)⇒S2(N−1)σ2≤S2(N−1)L1,σ2S2(N−1)≤L2S2(N−1)⇒S2(N−1)L2≤S2(N−1)σ2, por lo tanto, la probabilidad que buscamos es: P(S2(N−1)L2≤S2(N−1)σ2≤S2(N−1)L1)=1−α. Tenga en cuenta que S2(N−1)/σ2∼χ2(N−1) . Queremos entonces, ∫N−1S2(N−1)L2pχ2(x)dx=(1−α)/2 ,∫S2(N−1)L1N−1pχ2(x)dx=(1−α)/2 (integramos hasta N−1 porque el valor esperado de una variable aleatoria chi-cuadrado con N−1 grados de libertad es N−1 ) o, de forma equivalente, ∫S2(N−1)L20pχ2(x)dx=α/2,∫∞S2(N−1)L1pχ2(x)dx=α/2. Llamando a χ2α/2=S2(N−1)L2 y χ21−α/2=S2(N−1)L1 donde los valores χ2α/2 y χ21−α/2 se puede encontrar en las tablas de chi-cuadrado (¡en los ordenadores principalmente!) y resolviendo para L1 y L2 , L1=S2(N−1)χ21−α/2,L2=S2(N−1)χ2α/2. Por lo tanto, su intervalo de confianza para la varianza es C.I.=(S2(N−1)χ21−α/2,S2(N−1)χ2α/2).
8 votos
Se utiliza porque - cuando los datos son normales - Q=(n−1)s2σ2∼χ2n−1 . (Esto hace que Q una cantidad fundamental)
2 votos
Ver también stats.stackexchange.com/questions/15711/ y sus enlaces.
3 votos
Para aquellos que estén interesados en las aplicaciones o en seguir investigando sobre χ2 En el caso de que se trate de un proyecto de ley, deberá prestar atención a la distinción entre un χ2 ("chi-cuadrado") y una distribución χ ("chi") (es la raíz cuadrada de un χ2 (no es de extrañar).