La forma en que el enfoque de Fisher mide el efecto combinado de los valores p es mirar efectivamente su producto (el ordenamiento de posibles estadísticas al agregar los logaritmos es el mismo que al tomar el producto). Luego pregunta si esto es inusualmente bajo en comparación con lo que encontrarías con valores p aleatorios cuando la nula es verdadera (que serían extracciones de una distribución uniforme en ese caso).
En el producto, los valores muy pequeños "tiran hacia abajo" el valor más de lo que los valores muy grandes lo empujan hacia arriba (en comparación con un valor típico). Una probabilidad grande no puede ser superior a 1, pero una pequeña puede ser muy pequeña de hecho.
Según esa métrica de producto, un producto de muchos 0,5 es inusual en comparación con un producto de valores uniformes aleatorios. Si tus resultados realmente no mostraran nada, deberías ver algunos p pequeños ahí, pero no tienes ninguno. Al recolectar muchos 0,5 básicamente te estás adentrando en el territorio de 'aún menos discrepante que la aleatoriedad' ... lo que por supuesto no te llevaría a rechazarlo.
![introducir descripción de la imagen aquí]()
El histograma es del valor p combinado de Fisher para una muestra de 1000 conjuntos de 10 valores p aleatorios (uniformes), la curva verde es la densidad real, la de un \chi^2_{20}, mientras que la línea marrón marca la posición para el valor p combinado cuando hay 10 valores, cada uno con p=0.5.
Observa que los valores grandes - valores en la cola derecha - son altamente significativos. El conjunto de diez valores 0.5 está bien dentro de la cola izquierda, por lo que no indican significancia.
Aunque el método de Fisher tiene mucho que recomendar (no menos importante es que tiene mucho sentido intuitivo trabajar con un producto de valores p independientes), en realidad no hay nada sagrado acerca de esa métrica. Por ejemplo, podrías sumar valores p y comparar esa suma con la distribución de una suma de valores p aleatorios. Por esa métrica, muchos p=0.5 te darían un valor justo en el medio. (Existen muchas otras formas en las que se pueden combinar los valores p. Principalmente yo solo sigo con Fisher, aunque generalmente captura lo que quiero que un "valor p combinado" capture).
2 votos
Tenga en cuenta que la prueba exacta de Fisher no tiene nada que ver con el método de Fisher para combinar valores p, por lo que eliminé su etiqueta
3 votos
Me he tomado la libertad de agregar la etiqueta
python
. Donde sea posible, se debe indicar el lenguaje en el que se escribe el código, tanto para aquellas personas que no lo reconocen de inmediato, como para facilitar búsquedas.1 votos
"Porque si has realizado pruebas que no dicen absolutamente nada (=el significado de p=0.5)" - esta no es la interpretación correcta de p=0.5, especialmente no para pruebas de dos colas. Las pruebas que son completamente consistentes con la hipótesis nula tienen p=1.