5 votos

Prueba de chi-cuadrado

Estoy leyendo sobre la prueba de chi-cuadrado pero me encontré con la prueba de chi-cuadrado de independencia, la prueba de chi-cuadrado de bondad de ajuste y la prueba de chi-cuadrado de varianza. Estoy confundido y no puedo encontrar cuál es la diferencia entre estos tres.

He encontrado teorías pero necesitaba algunos ejemplos para comprender estas cosas claramente.

PD: Mi entendimiento es que la prueba de chi-cuadrado de independencia = prueba de chi-cuadrado de asociación = prueba de chi-cuadrado de homogeneidad. Por favor, corríjame si mi entendimiento es incorrecto.

7voto

manku Puntos 111

Distribución de coincidencias. Una variable con varias categorías. Un ejemplo clásico es lanzar un dado y probar si es 'justo', lo que significa que las probabilidades de cada uno de los seis números deben ser iguales.

Ejemplo con un dado justo simulado. El procedimiento R asume que la hipótesis nula es que las probabilidades de las categorías son iguales, si no se especifican otras probabilidades. El valor P supera el 5%, por lo que no hay evidencia al nivel del 5% de que el dado sea injusto.

Datos:

Caras
  1   2   3   4   5   6 
 88  81 102  80  73  76 

Prueba en R:

Counts= c(88. 81, 102, 80, 73, 76)
chisq.test(Counts)

    Prueba de Chi-cuadrado para probabilidades dadas

datos:  Counts
Chi-cuadrado = 6.568, df = 5, valor p = 0.2548

Independencia. Dos variables categóricas. Te preguntas si son independientes. Ejemplo: Tienes 200 sujetos, que pueden clasificarse en dos tipos de categorías. Quizás tipo de trabajo y cantidad de educación. Te preguntas si las categorías son independientes.

Homogeneidad. Tienes 200 sujetos de cada una de cinco ciudades. Tu otra variable categórica podría ser la preferencia religiosa. Quieres saber si la distribución a varias afiliaciones es uniforme en todas las ciudades.

Ejemplo numérico con dos ciudades; prueba en R. La hipótesis nula es rechazada con un valor P cercano a 0. (La Ciudad A es mucho más diversa en cuanto a religión que la Ciudad B).

Datos falsos:

Pref Religiosa:    C   P   J   I   H  Otro/Ninguno  TOTAL
Ciudad A        34  39  33  35  24   35           200
Ciudad B        64  59  36  16  14   14           200

Prueba en R:

a = c(34, 39, 33, 35, 24, 35)
b = c(62, 58, 36, 16, 14, 14)

TAB = rbind(a,b)
chisq.test(TAB)

        Prueba de Chi-cuadrado de Pearson

datos:  TAB
Chi-cuadrado = 30.729, df = 5, valor p = 1.06e-05

En general, las pruebas de chi-cuadrado de independencia y homogeneidad son esencialmente iguales desde un punto de vista computacional. Los detalles de interpretación si se rechaza la hipótesis nula a menudo difieren entre las pruebas de independencia y homogeneidad.

En las tres pruebas anteriores para datos categóricos, una estadística de prueba derivada de recuentos 'observados' y 'esperados' tiene aproximadamente una distribución chi-cuadrado con grados de libertad que dependen del número de niveles de variables categóricas. (Consulta un texto básico de estadística o páginas en línea para obtener detalles).

Prueba de varianza. Completamente diferente a lo anterior. Para datos de proporción continua de una población normal, si deseas probar si la varianza de la población tiene un valor particular, usarías esta prueba.

Por ejemplo: Tienes 50 observaciones de una población normal y deseas probar $H_0: \sigma^2 = \sigma_0^2 = 10$ frente a $H_a: \sigma^2 \ne 10.$ Basándote en el hecho de que la varianza muestral $S^2$ tiene $\frac{(n-1)S^2}{\sigma_0^2} \sim \mathsf{Chisq}(\nu = n-1).$

Aquí tienes un ejemplo de una prueba con $n = 50$ observaciones y $S^2 = 12.7,$ usando el software estadístico Minitab. Con 50 observaciones distribuidas normalmente, una varianza muestral de 12.7 es consistente con una varianza poblacional de 10.

Prueba e IC para una Varianza 

Método

Hipótesis nula         σ-al cuadrado = 10
Hipótesis alternativa  σ-al cuadrado ≠ 10

El método de chi-cuadrado es solo para la distribución normal.

Estadísticas

 N  DesEstd  Varianza
50   3.56      12.7

Intervalos de Confianza del 95%

               IC para        IC para
Método          DesEstd       Varianza
Chi-Cuadrado  (2.98, 4.44)  (8.9, 19.7)

Pruebas

                 Prueba
Método      Estadística  DF  Valor P
Chi-Cuadrado      62.23  49    0.194

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X