Estoy haciendo estudios de asociación de SNP de GWAS sobre enfermedades utilizando un software llamado plink ( http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml ).
Con los resultados de asociación obtengo los valores p para todos los SNPs analizados. Ahora, utilizo un gráfico QQ de esos valores p para mostrar si un valor p muy bajo difiere de la distribución esperada de los valores p (una distribución uniforme). Si un valor p se desvía de la distribución esperada uno "puede" llamar a ese valor p de la estadística significativo.
Como se puede ver en el gráfico QQ, en la cola superior, los últimos 4 puntos son algo difíciles de interpretar. Dos de los últimos puntos en gris sugieren que esos valores p están en la distribución esperada de valores p, mientras que los otros dos no lo están.
Ahora, cómo interpretar esto, los dos últimos puntos tienen baja p-valores pero no son "significativos" según el QQ-plot, mientras que los otros dos puntos con más alto ¿Los valores p son "significativos"? ¿Cómo puede ser esto cierto?
6 votos
Un problema con el uso de los gráficos QQ para interpretar los GWAS es que los valores p no son independientes entre sí y, de hecho, es muy probable que los valores p más extremos estén correlacionados. Supongo que los cuatro resultados más importantes están probablemente en el mismo cromosoma y están lo suficientemente cerca el uno del otro como para que el LD esté causando una correlación entre ellos. Si se ejecuta la prueba que dio el segundo valor p más bajo condicionado al SNP con el valor p más bajo, supongo que su valor p caería en el rango no excepcional. Lo mismo ocurriría probablemente con muchos de los otros aciertos aparentes.
4 votos
Ya lo he hecho, he podado el conjunto de datos de SNP para obtener sólo SNPs independientes (utilizando un r-cuadrado de 0,8 como límite). Este gráfico QQ muestra los resultados de los SNPs independientes, o SNPs en LD < 0.8.
1 votos
El SNP más bajo corresponde al cromosoma 6, el segundo al cromosoma 2, el tercero al cromosoma 5, el cuarto al cromosoma 9, así que no estoy tan seguro de que el LD sea un problema aquí.
1 votos
¿Puedo preguntarle cómo hizo esa trama? Puedo obtener algo similar pero con valores de chi-cuadrado o con valores p pero sin la sombra gris y necesito uno con valores p y la sombra gris. Si pudieras compartir el código que usaste sería genial. Gracias.
0 votos
Aquí folk.uio.no/tores/Publications_files/ es un documento clásico sobre este problema.