Pido disculpas si esta pregunta es demasiado general. Estoy dispuesto a editarla si es necesario. Dicho esto, me he encontrado con este resultado contraintuitivo dos veces ya, y me gustaría saber si hay una solución conocida y general para ello.
Cuando trabajo con muchos datos de biología, suelo hacer alguna combinación de:
- puntuar una lista de posibles aciertos, por ejemplo, "¿cuáles son las proteínas más probables en mi muestra, de mayor a menor probabilidad?"
- Recogida de múltiples réplicas
- combinar las listas de puntuación entre las réplicas
- aplicar una corrección de comparación múltiple, por ejemplo, un corte FDR.
El problema es que cuando combino listas de múltiples réplicas, a veces encuentro menos resultados después de la corrección por comparación múltiple. Es decir, en contra de la lógica, más los datos hacen que mis resultados peor . Creo que esto se debe a que los verdaderos positivos tienden a solaparse entre las listas (son reales) mientras que los falsos positivos no (son aciertos aleatorios y espurios). Por lo tanto, al combinar, los falsos positivos se acumulan más rápido que los verdaderos. He aquí un ejemplo:
La lista 1 y la lista 2 tienen tres TP y dos FP (precisión = 3 / 5 = 60% ), y, si aplicamos un límite de FDR del 50%, devolveríamos todos los cinco golpes de cada lista. Por otro lado, la lista combinada tiene una precisión total de 50% aplicando un límite de FDR del 50%, se obtiene cuatro golpes . Según ambas medidas, la lista combinada es peor. Y simplemente parece peor, por ejemplo, hay menos TP cerca de los primeros puestos.
El efecto depende, obviamente, de cómo haya elegido combinar las listas. Por un lado, la lista combinada no es redundante (por ejemplo, A sólo aparece una vez), y por otro, he combinado las puntuaciones tomando el valor máximo (en lugar de, por ejemplo, la media). Por lo que he visto, ambas son opciones comunes, aunque estoy bastante seguro de que es aquí donde está mi error. Mis soluciones hasta ahora son ad hoc, por ejemplo, diferentes reglas para combinar las puntuaciones.
Pregunta 1: ¿Existe un principio general en este caso? Como he dicho, me he encontrado con esto dos veces... (¡debe haber una tesis al respecto!)
Pregunta 2: ¿Podría combinar las puntuaciones de forma "bayesiana"? No sé qué significa eso en la práctica, aunque "acumular pruebas" me hace pensar en "bayesiano".