Processing math: 100%

24 votos

¿Por qué se utiliza el chi cuadrado al crear un intervalo de confianza para la varianza?

Esta es una pregunta muy básica. ¿Por qué utilizamos una distribución chi-cuadrado? ¿Qué significa esta distribución? ¿Por qué es la distribución utilizada para crear un intervalo de confianza para la varianza?

Cada lugar que busco en Google para una explicación sólo presenta este hecho, explicando cuándo usar el chi, pero no explicando por qué utilizar el chi, y por qué tiene el aspecto que tiene.

Muchas gracias a quien me pueda orientar en la dirección correcta y es - entender realmente por qué estoy usando chi cuando estoy creando un intervalo de confianza para la varianza.

8 votos

Se utiliza porque - cuando los datos son normales - Q=(n1)s2σ2χ2n1 . (Esto hace que Q una cantidad fundamental)

2 votos

Ver también stats.stackexchange.com/questions/15711/ y sus enlaces.

3 votos

Para aquellos que estén interesados en las aplicaciones o en seguir investigando sobre χ2 En el caso de que se trate de un proyecto de ley, deberá prestar atención a la distinción entre un χ2 ("chi-cuadrado") y una distribución χ ("chi") (es la raíz cuadrada de un χ2 (no es de extrañar).

28voto

Andrew Puntos 126

Respuesta rápida

La razón es que, asumiendo que los datos son i.i.d. y XiN(μ,σ2) y definiendo ˉX=NXiNS2=N(ˉXXi)2N1 al formar los intervalos de confianza, la distribución muestral asociada a la varianza de la muestra ( S2 (recuerde, ¡una variable aleatoria!) es una distribución chi-cuadrado ( S2(N1)/σ2χ2n1 ), al igual que la distribución muestral asociada a la media de la muestra es una distribución normal estándar ( (ˉXμ)n/σZ(0,1) ) cuando se conoce la varianza, y con una t-student cuando no se conoce ( (ˉXμ)n/STn1 ).

Respuesta larga

En primer lugar, vamos a demostrar que S2(N1)/σ2 sigue una distribución chi-cuadrado con N1 grados de libertad. A continuación, veremos la utilidad de esta prueba a la hora de derivar los intervalos de confianza para la varianza, y cómo aparece la distribución chi-cuadrado (¡y por qué es tan útil!). Comencemos.

La prueba

Para ello, tal vez deba acostumbrarse a la distribución chi-cuadrado en este Artículo de Wikipedia . Esta distribución sólo tiene un parámetro: los grados de libertad, ν y resulta que tiene una función generadora de momentos (MGF) dada por: mχ2ν(t)=(12t)ν/2. Si podemos demostrar que la distribución de S2(N1)/σ2 tiene una función generadora de momentos como ésta, pero con ν=N1 entonces hemos demostrado que S2(N1)/σ2 sigue una distribución chi-cuadrado con N1 grados de libertad. Para demostrarlo, hay que tener en cuenta dos hechos:

  1. Si definimos, Y=(XiˉX)2σ2=Z2i, donde ZiN(0,1) es decir, variables aleatorias normales, la función generadora de momentos de Y viene dada por mY(t)=E[etY]=E[etZ21]×E[etZ22]×...E[etZ2N]=mZ2i(t)×mZ22(t)×...mZ2N(t). El MGF de Z2 viene dada por mZ2(t)=f(z)exp(tz2)dz=(12t)1/2, donde he utilizado el PDF de la normal estándar, f(z)=ez2/2/2π y, por lo tanto, mY(t)=(12t)N/2, que implica que Y sigue una distribución chi-cuadrado con N grados de libertad .

  2. Si Y1 y Y2 son independientes y cada una se distribuye como una distribución chi-cuadrado pero con ν1 y ν2 grados de libertad, entonces W=Y1+Y2 se distribuye con una distribución chi-cuadrado con ν1+ν2 grados de libertad (esto se deduce de tomar el MGF de W (¡hazlo!).

Con los datos anteriores, obsérvese que si se multiplica la varianza de la muestra por N1 se obtiene (tras un poco de álgebra), (N1)S2=n(ˉXμ)+(Xiμ)2, y, por lo tanto, dividiendo por σ2 , (N1)S2σ2+(ˉXμ)2σ2/N=(Xiμ)2σ2. Obsérvese que el segundo término del lado izquierdo de esta suma se distribuye como una distribución chi-cuadrado con 1 grado de libertad, y la suma del lado derecho se distribuye como una chi-cuadrado con N grados de libertad. Por lo tanto, S2(N1)/σ2 se distribuye como un chi-cuadrado con N1 grados de libertad .

Cálculo del intervalo de confianza para la varianza.

Cuando se busca un intervalo de confianza para la varianza, se desea conocer los límites L1 y L2 en P(L1σ2L2)=1α. Juguemos con la desigualdad dentro del paréntesis. Primero, dividamos por S2(N1) , L1S2(N1)σ2S2(N1)L2S2(N1). Y luego recuerda dos cosas: (1) la estadística S2(N1)/σ2 tiene una distribución chi-cuadrado con N1 grados de libertad y (2) las varianzas son siempre mayores que cero, lo que implica que se pueden invertir las desigualdades, porque L1S2(N1)σ2S2(N1)S2(N1)σ2S2(N1)L1,σ2S2(N1)L2S2(N1)S2(N1)L2S2(N1)σ2, por lo tanto, la probabilidad que buscamos es: P(S2(N1)L2S2(N1)σ2S2(N1)L1)=1α. Tenga en cuenta que S2(N1)/σ2χ2(N1) . Queremos entonces, N1S2(N1)L2pχ2(x)dx=(1α)/2   ,S2(N1)L1N1pχ2(x)dx=(1α)/2   (integramos hasta N1 porque el valor esperado de una variable aleatoria chi-cuadrado con N1 grados de libertad es N1 ) o, de forma equivalente, S2(N1)L20pχ2(x)dx=α/2,S2(N1)L1pχ2(x)dx=α/2. Llamando a χ2α/2=S2(N1)L2 y χ21α/2=S2(N1)L1 donde los valores χ2α/2 y χ21α/2 se puede encontrar en las tablas de chi-cuadrado (¡en los ordenadores principalmente!) y resolviendo para L1 y L2 , L1=S2(N1)χ21α/2,L2=S2(N1)χ2α/2. Por lo tanto, su intervalo de confianza para la varianza es C.I.=(S2(N1)χ21α/2,S2(N1)χ2α/2).

0 votos

Gracias por la respuesta detallada. Sin embargo, mi pregunta es mucho más básica: ¿por qué es (S2(N1)/2 la estadística y no S2? ¿Por qué esta estadística tiene una distribución Chi cuadrada? ¿Qué significa esto?

2 votos

Simplemente porque S2 no sigue una distribución chi-cuadrado centrada, mientras que S2(N1)/σ2 y, por lo tanto, es más fácil trabajar con él. ¿Está pidiendo una derivación para eso? (es decir, quieres que alguien te muestre que S2(N1)/σ2 sigue una distribución chi-cuadrado con N1 grados de libertad)

4 votos

Sería útil modificar esta respuesta para incluir el muy fuerte pero no se ha dicho que la varianza de la muestra sigue una distribución chi-cuadrado cuando los datos subyacentes son independiente y seguir una normal distribución. A diferencia de la teoría de la distribución de la media muestral, donde en la práctica su distribución muestral será aproximadamente Normal a una precisión razonable en muchas situaciones, este mismo comportamiento asintótico tiende a no ocurrir con la varianza de la muestra (hasta que los tamaños de las muestras se vuelven extremadamente grandes).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X