Se trata más bien de una pregunta postmortem en forma de experimento particular, por lo que lamentablemente no puedo volver atrás y cambiar el diseño experimental.
Datos - Tengo datos de metilación humana, ~400K sondas (filas), ~200 muestras (columnas). Las muestras están divididas en 3 categorías (enfermedades).
Parámetro de interés - Tengo un valor entero de 1:50 que se asigna a cada muestra.
La prueba - Estoy buscando sondas que se correlacionen con el parámetro de interés, para un grupo de enfermedades en particular. Para ello he utilizado el paquete Limma en R. (Ejemplo de código abajo).
El problema Nada sobrevive a la corrección de las pruebas múltiples. Hay dos cosas que ayudarían en esta situación, añadir más muestras (no puedo hacer eso), o reducir el número de sondas (no hay razón para eso). ¿Hay alguna otra opción que tenga? (He probado las diferentes formas de ajuste del valor P en Limma y en todas ellas no pasa nada). La razón por la que pregunto es que si compruebo las sondas con un valor P bajo (< 0,0001), sus correlaciones parecen ajustadas y convincentes.
Código
lvcm.design <- model.matrix(~as.numeric(pData(lvcm.in)$Variable))
lvcm.fit <- lmFit(minfi::getM(lvcm.in), lvcm.design)
lvcm.fit2 <- eBayes(lvcm.fit)
topTable(fit = lvcm.fit2,
coef = 2,
p.value = 0.05,
number = Inf,
adjust.method = "BH",
sort.by = "P")