2 votos

Aplicación de la corrección de pruebas múltiples: ¿hay algo que pueda hacer?

Se trata más bien de una pregunta postmortem en forma de experimento particular, por lo que lamentablemente no puedo volver atrás y cambiar el diseño experimental.

Datos - Tengo datos de metilación humana, ~400K sondas (filas), ~200 muestras (columnas). Las muestras están divididas en 3 categorías (enfermedades).

Parámetro de interés - Tengo un valor entero de 1:50 que se asigna a cada muestra.

La prueba - Estoy buscando sondas que se correlacionen con el parámetro de interés, para un grupo de enfermedades en particular. Para ello he utilizado el paquete Limma en R. (Ejemplo de código abajo).

El problema Nada sobrevive a la corrección de las pruebas múltiples. Hay dos cosas que ayudarían en esta situación, añadir más muestras (no puedo hacer eso), o reducir el número de sondas (no hay razón para eso). ¿Hay alguna otra opción que tenga? (He probado las diferentes formas de ajuste del valor P en Limma y en todas ellas no pasa nada). La razón por la que pregunto es que si compruebo las sondas con un valor P bajo (< 0,0001), sus correlaciones parecen ajustadas y convincentes.

Código

lvcm.design <- model.matrix(~as.numeric(pData(lvcm.in)$Variable))
lvcm.fit    <- lmFit(minfi::getM(lvcm.in), lvcm.design)
lvcm.fit2   <- eBayes(lvcm.fit)
topTable(fit           = lvcm.fit2,
         coef          = 2,
         p.value       = 0.05,
         number        = Inf,
         adjust.method = "BH",
         sort.by       = "P")

1voto

Gumeo Puntos 1671

Podría probar el filtro de imitación para controlar el FDR. Hay un en R para ello.

Aquí están algunas diapositivas de Emmanuel Candes para empezar.

1voto

codymanix Puntos 12119

Dado que tus datos están naturalmente estratificados en tres enfermedades, te sugiero que consultes el estudio de Lei Sun et al. FDR estratificado método. Básicamente, las tres enfermedades se corrigen por separado, asumiendo diferentes $\pi_0$ o proporción de la hipótesis nula. El documento explica muy bien el método, pero si tienes alguna pregunta no lo dudes.

0voto

Gnuffo1 Puntos 128

Si su variable tiene diferentes condiciones, considere la posibilidad de construir la matriz del modelo de manera diferente, bloqueando cada grupo como una variable algo así:

         Group1 | Group2 | Group3
Sample_1    1   |    0   |   0
Sample_2    1   |    0   |   0
Sample_3    0   |    1   |   0
Sample_4    0   |    1   |   0
Sample_5    0   |    0   |   1
Sample_6    0   |    0   |   1

De este modo, su modelo tiene más potencia y puede discriminar mejor entre los grupos de su variable de interés

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X