4 votos

Control de una tercera variable en el análisis de chi-cuadrado

Tengo $n$ individuos pertenecientes a cinco grupos diferentes. Me gustaría saber si esos grupos tienen un impacto significativo en un determinado factor $Y$ (con tres niveles posibles, A, B y C). Por lo tanto, me encuentro básicamente en el caso de un análisis chi-cuadrado con "Grupo" y $Y$ como entradas.

El problema es el siguiente. Sé que el sexo de un individuo también influye $Y$ y la proporción de sexos en cada grupo no está equilibrada: en algunos grupos hay más hombres y en otros hay más mujeres. Por lo tanto, me gustaría controlar el factor Sexo en este análisis.

No me interesa probar la independencia de todos los factores ("¿hay más mujeres en el Grupo1 que en el Grupo2?", evidentemente, no me interesa), sino realmente probar la independencia de Grupo y $Y$ cuando se controla el sexo.

¿Qué tipo de modelo o análisis debo utilizar?

5voto

Sean Hanley Puntos 2428

Su caso, tal y como lo ha descrito, es exactamente la situación que la Prueba de Cochran-Mantel-Haenszel está diseñado para. Mucha gente está familiarizada con ella sólo en el caso de que haya muchos $2\times 2$ pero hay generalizaciones que se aplican a las tablas con más de dos filas y más de dos columnas. Además, puede tener sólo dos estratos. Así, en tu caso tienes $3$ filas y $5$ columnas que desea probar la independencia (como una prueba tradicional de chi-cuadrado), pero controlando el sexo (lo que equivale a $2$ estratos).

Una cosa a tener en cuenta es que la prueba CMH asume que el efecto del grupo sobre Y es el mismo en todos los niveles de sexo, es decir, que no hay interacción grupo x sexo. Si usted cree que la hay, o quiere probar dicha interacción, necesitaría una prueba diferente. Sin embargo, no parece estar interesado en eso, y esta es la prueba más sencilla que le dará lo que quiere, ya que está operando bajo esa suposición.

La mayoría de los programas informáticos de estadística deberían poder hacerlo. Aquí hay un ejemplo rápido, codificado en R :

dat = as.table(array(1:30, dim=c(3, 5, 2),
                     dimnames=list(    Y=c("A", "B", "C"),
                                   Group=c("g1", "g2", "g3", "g4", "g5"),
                                     Sex=c("Male", "Female"))))
dat
# , , Sex = Male
# 
#    Group
# Y   g1 g2 g3 g4 g5
#   A  1  4  7 10 13
#   B  2  5  8 11 14
#   C  3  6  9 12 15
# 
# , , Sex = Female
# 
#    Group
# Y   g1 g2 g3 g4 g5
#   A 16 19 22 25 28
#   B 17 20 23 26 29
#   C 18 21 24 27 30
mantelhaen.test(dat)
#   Cochran-Mantel-Haenszel test
# 
# data:  dat
# Cochran-Mantel-Haenszel M^2 = 0.19448, df = 8, p-value = 1

2voto

Zizzencs Puntos 1358

Sugiero utilizar la regresión logística multinomial con Y como variable dependiente y el sexo y el grupo como variables independientes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X