Distribución de coincidencias. Una variable con varias categorías. Un ejemplo clásico es lanzar un dado y probar si es 'justo', lo que significa que las probabilidades de cada uno de los seis números deben ser iguales.
Ejemplo con un dado justo simulado. El procedimiento R asume que la hipótesis nula es que las probabilidades de las categorías son iguales, si no se especifican otras probabilidades. El valor P supera el 5%, por lo que no hay evidencia al nivel del 5% de que el dado sea injusto.
Datos:
Caras
1 2 3 4 5 6
88 81 102 80 73 76
Prueba en R:
Counts= c(88. 81, 102, 80, 73, 76)
chisq.test(Counts)
Prueba de Chi-cuadrado para probabilidades dadas
datos: Counts
Chi-cuadrado = 6.568, df = 5, valor p = 0.2548
Independencia. Dos variables categóricas. Te preguntas si son independientes. Ejemplo: Tienes 200 sujetos, que pueden clasificarse en dos tipos de categorías. Quizás tipo de trabajo y cantidad de educación. Te preguntas si las categorías son independientes.
Homogeneidad. Tienes 200 sujetos de cada una de cinco ciudades. Tu otra variable categórica podría ser la preferencia religiosa. Quieres saber si la distribución a varias afiliaciones es uniforme en todas las ciudades.
Ejemplo numérico con dos ciudades; prueba en R. La hipótesis nula es rechazada con un valor P cercano a 0. (La Ciudad A es mucho más diversa en cuanto a religión que la Ciudad B).
Datos falsos:
Pref Religiosa: C P J I H Otro/Ninguno TOTAL
Ciudad A 34 39 33 35 24 35 200
Ciudad B 64 59 36 16 14 14 200
Prueba en R:
a = c(34, 39, 33, 35, 24, 35)
b = c(62, 58, 36, 16, 14, 14)
TAB = rbind(a,b)
chisq.test(TAB)
Prueba de Chi-cuadrado de Pearson
datos: TAB
Chi-cuadrado = 30.729, df = 5, valor p = 1.06e-05
En general, las pruebas de chi-cuadrado de independencia y homogeneidad son esencialmente iguales desde un punto de vista computacional. Los detalles de interpretación si se rechaza la hipótesis nula a menudo difieren entre las pruebas de independencia y homogeneidad.
En las tres pruebas anteriores para datos categóricos, una estadística de prueba derivada de recuentos 'observados' y 'esperados' tiene aproximadamente una distribución chi-cuadrado con grados de libertad que dependen del número de niveles de variables categóricas. (Consulta un texto básico de estadística o páginas en línea para obtener detalles).
Prueba de varianza. Completamente diferente a lo anterior. Para datos de proporción continua de una población normal, si deseas probar si la varianza de la población tiene un valor particular, usarías esta prueba.
Por ejemplo: Tienes 50 observaciones de una población normal y deseas probar $H_0: \sigma^2 = \sigma_0^2 = 10$ frente a $H_a: \sigma^2 \ne 10.$ Basándote en el hecho de que la varianza muestral $S^2$ tiene $\frac{(n-1)S^2}{\sigma_0^2} \sim \mathsf{Chisq}(\nu = n-1).$
Aquí tienes un ejemplo de una prueba con $n = 50$ observaciones y $S^2 = 12.7,$ usando el software estadístico Minitab. Con 50 observaciones distribuidas normalmente, una varianza muestral de 12.7 es consistente con una varianza poblacional de 10.
Prueba e IC para una Varianza
Método
Hipótesis nula σ-al cuadrado = 10
Hipótesis alternativa σ-al cuadrado ≠ 10
El método de chi-cuadrado es solo para la distribución normal.
Estadísticas
N DesEstd Varianza
50 3.56 12.7
Intervalos de Confianza del 95%
IC para IC para
Método DesEstd Varianza
Chi-Cuadrado (2.98, 4.44) (8.9, 19.7)
Pruebas
Prueba
Método Estadística DF Valor P
Chi-Cuadrado 62.23 49 0.194