6 votos

Medida de Asociación para tablas de contingencia de 2 x 3

Tengo una tabla de contingencia de 2 x 3 - la variable de fila es un factor, la variable de columna es un factor ordenado (nivel ordinal). Me gustaría aplicar cualquier técnica de asociación simétrica o asimétrica. ¿Qué me recomiendas que haga? ¿Técnica que le parece el más apropiado?

13voto

pirho Puntos 1387

En un 2x3 tabla de contingencia donde los tres niveles del factor se ordena usted puede utilizar el rango de correlación (Spearman o de Kendall) para evaluar la asociación entre las dos variables.

Usted también puede pensar acerca de los datos como un ordenado variable observada en dos grupos. Correspondiente a la significación de la prueba podría ser la prueba de Mann-Whitney (con muchos lazos). Este tiene asociada una medida de asociación, el MMM probabilidades, relativa a la Agresti generalizado odds ratio.

Tanto para el rango de los coeficientes de correlación y MMM probabilidades de intervalos de confianza puede ser calculado. Me parece probabilidades más intuitiva, de lo contrario creo que ambos tipos de medidas son las adecuadas.

9voto

Zizzencs Puntos 1358

Puede utilizar la prueba de Jonckheere Terpstra. En SAS, puede conseguirlo en PROC FREQ con la opción /JT en la declaración de tablas. No veo una función para él en R, pero puede haber uno por ahí.

5voto

DavLink Puntos 101

Lineal o tendencia monotónica pruebas - $M^2$ asociación de medida, MMM prueba citada por @GaBorgulya, o el de Cochran-Armitage prueba de tendencia--también pueden ser utilizados, y que están bien explicadas en Agresti (CDA, 2002, §3.4.6, p. 90).

El último es en realidad equivalente a una puntuación de prueba para las pruebas de $H_0:\; \beta = 0$ en un modelo de regresión logística, pero puede ser calculada a partir de la $M^2$ estadística, definida como $(n-1)r^2$ ($\sim\chi^2(1)$ para muestra grande), donde $r$ es la muestra coeficiente de correlación entre las dos variables (el ordinal medida de ser recodificados como los resultados numéricos), mediante la sustitución de $n-1$ $n$ (ibíd., p. 182). Es fácil de calcular en cualquier software estadístico, pero usted puede también utilizar la moneda paquete en R (I se proporciona un ejemplo de uso de una pregunta relacionada).

Nota al margen

Si usted está usando R, encontrará recursos útiles en cualquiera de Laura Thompson (R y S-PLUS) Manual para Acompañar a Agresti del Análisis de Datos Categóricos (2002), que muestra cómo replicar Agresti resultados con R, o la gnm paquete (y su compañero de paquetes, vcd y vcdExtra) que permite el ajuste de la fila-columna de los modelos de asociación (véase la viñeta, Generalizada de modelos no lineales en R: Una visión de conjunto de la gnm paquete).

2voto

patfla Puntos 1

Una manera de integrar el orden de la columna factor en su análisis es utilizar el acumulado de las frecuencias en lugar de las frecuencias de células. Así, en la tabla se tiene:

$$f_{ij}=\frac{n_{ij}}{n_{\bullet\bullet}}\;\;\;\; i=1,2\;\;j=1,2,3$$

donde un "$\bullet$" indica que suma más de ese índice. Así que lo que sugiere el modelado de lugar:

$$g_{ij}=\sum_{k=1}^{j}f_{ik}$$

Ahora que, básicamente, tienen una simple hipótesis para la asociación, que el índice de $i$ no importa. Así que usted tiene:

$$E(g_{ij}|H_{0})=\sum_{k=1}^{j}\frac{n_{\bullet k}}{n_{\bullet\bullet}}$$

Y, a continuación, utilizar el buen viejo "entropía" estadístico de prueba:

$$T(H_{0})=n_{\bullet\bullet}\sum_{i,j}g_{ij}log\left(\frac{g_{ij}}{E(g_{ij}|H_{0})}\right)$$

Conectar los números da:

$$T(H_{0})=\sum_{i,j}\left(\sum_{k=1}^{j}n_{ik}\right)log\left(\frac{\sum_{k=1}^{j}n_{ik}}{\sum_{k=1}^{j}n_{\bullet k}}\right)$$

Y usted rechazar, si este número es demasiado grande, debe ser interpretada como un "log-odds ratio" que ayudará con la elección de cut-offs.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X