4 votos

¿Cómo puedo obtener un $p$ -valor de la prueba de tendencia de Cochran-Armitage?

Estoy trabajando con datos SNP de GWAS y quiero realizar varias pruebas de asociación entre genotipo y fenotipo. Hay dos fenotipos (caso y control) y 2 o tres genotipos. La mayoría son pruebas Chi-cuadrado con diferentes tablas de contingencia, $2 \times 2$ ou $2 \times 3$ una de ellas es la prueba de tendencia de Cochran-Armitage (CATT)

Una vez construida la tabla de contingencia, puedo obtener fácilmente una $p$ -mediante la tecla Biblioteca matemática Apache commons para las pruebas Chi-cuadrado. No hay problema.

Sin embargo, la explicación de la CATT en Wikipedia no me basta para aplicarlo (mis conocimientos de estadística son limitados y aún estoy aprendiendo).

Como en el ejemplo, sospecho una tendencia lineal, así que mis ponderaciones son $t = (0,1,2)$ lo que hace que la fórmula para $T$ a: $$ T \equiv (N_{12}R_2 - N_{22}R_1) + 2(N_{13}R2 - N_{23}R1) $$ y el de la varianza $$ Var(T) = {{R_1 R_2} \over N} ( N(C_2+4C_3) - (C_2 - 2C_3)^2) $$

He comprobado cómo el programa PLINK lo hace, puesto que ya está implementado allí, pero difiere ligeramente de las fórmulas anteriores. El código fuente C++ allí correspondería a esto: $$ T = {(N_{12}R_2 - N_{22}R_1) + 2(N_{13}R2 - N_{23}R1)\over N} $$ y $$ Var(T) = {{R_1 R_2} \over N} {( N(C_2+4C_3) - (C_2 - 2C_3)^2) \over N^2} $$

A continuación, calcula un valor de chi-cuadrado como el siguiente $$ \chi^2_{T} = {T^2 \over Var(T)} $$ y calcula el $p$ -como para cualquier otro valor chi-cuadrado con $df = 1$

No necesito entender la teoría por completo, siempre que mi programa calcule correctamente, pero entenderla me daría una confianza adicional.

¿Es esto correcto o legítimo? ¿Es así como obtendré el $p$ -¿Valor?

4voto

mat_geek Puntos 1367

Ésta es sólo una definición diferente de la estadística $T$ . Llame a su estadística $T_1$ y el otro $T_2$ . Tenga en cuenta la $T_2 = T_1/N$ y esa es la razón por la que la varianza de $T_2$ difiere de $T_1$ por un factor de $1/N^2$ . Sin embargo, debe tener en cuenta que el estadístico chi cuadrado es el mismo en ambos casos. Para $T_2$ existe un factor de $1/N^2$ en el numerador y el denominador que se anula y no aparece en la fórmula utilizando $T_1$ . Se utiliza la misma estadística de prueba en ambos casos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X