1 votos

¿Cómo comprobar si las variables se asocian con más frecuencia de lo esperado por el azar?

Tengo esta matriz de presencia/ausencia (S2 falta a propósito).

dat <- read.table(text="S1  S3  S4  S5  S6  S7  S8  S9  S10
0   0   1   1   0   0   1   0   0
0   0   1   1   0   0   1   0   0
0   0   1   0   0   0   0   0   0
0   0   0   1   0   0   0   0   1
0   0   1   1   0   0   1   0   0
0   0   1   1   0   0   0   0   0
0   0   1   1   0   1   1   0   0
0   0   0   0   0   0   0   1   0
0   0   1   1   0   0   1   0   0
0   0   1   0   0   0   0   0   1
1   0   0   0   1   0   0   0   0
0   0   1   0   0   0   0   0   0
0   1   0   0   0   1   0   0   0
0   0   0   1   0   0   1   1   0
0   0   0   0   0   0   0   1   0
0   0   1   1   0   0   1   0   0
1   1   0   0   0   1   0   1   1
1   1   1   0   0   0   0   1   1
0   0   0   1   0   0   1   0   0
0   0   0   1   0   0   1   0   0
0   0   0   1   0   0   0   0   0
0   0   1   1   0   0   1   0   0
0   0   0   0   0   0   1   0   0
1   0   0   0   0   0   0   0   0
0   0   1   0   0   0   0   0   0
1   0   0   0   0   0   0   0   0
0   0   0   1   0   0   1   0   0
1   0   0   1   0   0   0   0   0
0   0   0   0   0   0   1   0   0
1   0   0   0   0   0   0   0   0
0   0   0   0   0   0   1   0   0
0   0   0   0   0   0   1   0   0
0   0   1   1   0   0   1   0   0
0   0   1   1   0   0   0   0   0
0   0   0   1   0   0   0   0   0
0   0   0   0   0   0   1   0   0
0   0   0   0   0   0   1   0   0
0   0   1   1   0   0   0   0   0
0   0   0   1   0   0   0   0   0
0   0   0   1   0   0   1   0   0
1   0   1   1   0   0   0   0   0
0   0   0   1   0   0   0   0   0
0   0   1   1   0   0   0   0   0
0   0   1   0   0   0   0   0   0
0   0   0   1   0   0   0   0   0
0   0   1   1   0   0   0   0   0
0   0   1   0   0   0   0   0   0
0   0   0   0   0   0   1   1   0
0   0   1   0   0   0   0   0   0
1   1   0   0   0   0   0   1   1
0   0   1   1   0   0   0   0   0
0   0   1   0   0   0   1   0   0
0   0   1   1   0   0   0   0   0
0   0   0   0   0   0   1   0   0
0   0   1   1   0   1   1   1   0", header=T)

Al observar el número de veces que una determinada variable se encuentra con otra, me parece que S4, S5 y S8 se encuentran frecuentemente juntas. ¿Hay alguna forma de comprobarlo estadísticamente, ya sea para pares de variables o para tríos?

Saludos

2voto

jank Puntos 461

¿Podría un $\chi^2$ -prueba de independencia lograr lo que quieres hacer? Básicamente, se cruzan las variables de interés y se determinan las frecuencias esperadas asumiendo la independencia de los rasgos (si el rasgo A ocurre con frecuencia $f_A$ y la característica B con frecuencia $f_B$ para $N$ observaciones, se espera que la frecuencia ( $f_Af_B/N$ ) para $A \land B$ . Esto puede hacerse para cualquier número de variables. Dado el número de pares (36) y tripletes (84) posibles en este caso (9 variables), hay que ser muy cuidadoso a la hora de interpretar el resultado de cualquier prueba, especialmente si no se tiene ninguna hipótesis conceptual de antemano. Utilizar tu intuición como criterio para elegir el par o el triplete a considerar no resuelve el problema, ya que has utilizado datos reales para eliminar pruebas de la consideración.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X