7 votos

¿Qué hacer cuando no se cumplen los supuestos en una prueba de chi-cuadrado?

Estoy haciendo un análisis sobre una "segmentación a priori". Para examinar las diferencias significativas entre los dos segmentos se utilizaron tablas cruzadas y la prueba de chi-cuadrado.

Tipo de variables: categóricas

Tamaño de la muestra: 253

Programa utilizado: SPSS versión 21.

Problema: en varios aspectos no se cumple la hipótesis de una prueba de chi-cuadrado. En algunas tablas está escrito (por ejemplo): 4 celdas (22,2%) tienen un recuento esperado inferior a 5. El recuento mínimo esperado es 1,85 o 7 celdas (50,0%) tienen un recuento esperado inferior a 5. El recuento mínimo esperado es de 0,26. o 10 celdas (62,5%) tienen un recuento esperado inferior a 5. El recuento mínimo esperado es de 0,26.

¿Qué hay que hacer en este caso? ¿Debe evitarse la prueba de chi-cuadrado? ¿Qué prueba podría utilizarse en su lugar? La bibliografía dice que para las tablas de contingencia de 2x2 se puede utilizar la prueba exacta de Fisher. ¿Qué debe hacerse con tablas de contingencia más grandes (variables que implican varias categorías)?

12voto

bheklilr Puntos 113

Una solución sería utilizar una prueba bootstrap como aproximación a una prueba de permutación. Las pruebas de permutación son exactas y más potentes; en este caso hay demasiadas permutaciones para calcular cada una de ellas, así que se aproximaría la prueba con el bootstrap.

Básicamente, tú:

1) Calcule su estadística de prueba, etiquétela $T_0$ En los datos reales, digamos a título ilustrativo el mismo estadístico chi-cuadrado que ya has calculado,

2) Construya 1.000 o 10.000 tablas de contingencia aleatorias ("muchas") bajo el supuesto de que la hipótesis nula es verdadera, y para cada una de ellas calcule el estadístico chi-cuadrado, etiquételas $T_1 \dots T_B$ .

3) Compare el valor de su estadística de prueba $T_0$ con los valores estadísticos de la prueba $T_1 \dots T_B$ de las tablas de contingencia generadas aleatoriamente, y ver qué fracción es más extrema que $T_0$ esto le da un valor p bootstrap.

Estamos aproximando la distribución del estadístico de prueba bajo la hipótesis nula generando aleatoriamente un lote de valores para el estadístico de prueba bajo la hipótesis nula; esto nos permite estimar el valor p asociado al valor del estadístico que realmente observamos.

Lamentablemente, no puedo ayudarte con la parte del SPSS.

Aquí hay una referencia que me ha resultado útil en el pasado: Pruebas de hipótesis por permutación, paramétricas y Bootstrap (buenas) .

0voto

talonx Puntos 262

En el procedimiento de tabulación cruzada de SPSS puede utilizar una prueba exacta y/o puede utilizar el bootstrap. Exact ofrece una opción de Monte Carlo y exacta. Bootstrap ofrece la misma técnica de bootstrap disponible para un montón de procedimientos. Ambas están disponibles en el cuadro de diálogo Crosstabs si tiene las opciones de complemento pertinentes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X