Loading [MathJax]/jax/element/mml/optable/Latin1Supplement.js

7 votos

¿Por qué el método de Fisher produce p0.5 al combinar varios valores de p todos iguales a 0.5?

W = 0
para p en xrange(10):
    W += -2*log(0.5)
imprimir "W:",W
final_p = 1 - scipy.stats.chi2.cdf(W, 2*10)
imprimir "Valor p final",final_p

¿Por qué esto resulta en un valor p final de 0.84, cuando solo utilicé los valores p más insignificantes (p=0.5 para la hipótesis nula)? ¿No debería resultar en 0.5 también? Porque si has realizado pruebas que no dicen absolutamente nada (=el significado de p=0.5), ¿no querrías una conclusión que también diga absolutamente nada?

¿Me falta algo en el método de Fisher o en los valores p?

2 votos

Tenga en cuenta que la prueba exacta de Fisher no tiene nada que ver con el método de Fisher para combinar valores p, por lo que eliminé su etiqueta

3 votos

Me he tomado la libertad de agregar la etiqueta python. Donde sea posible, se debe indicar el lenguaje en el que se escribe el código, tanto para aquellas personas que no lo reconocen de inmediato, como para facilitar búsquedas.

1 votos

"Porque si has realizado pruebas que no dicen absolutamente nada (=el significado de p=0.5)" - esta no es la interpretación correcta de p=0.5, especialmente no para pruebas de dos colas. Las pruebas que son completamente consistentes con la hipótesis nula tienen p=1.

14voto

AdamSane Puntos 1825

La forma en que el enfoque de Fisher mide el efecto combinado de los valores p es mirar efectivamente su producto (el ordenamiento de posibles estadísticas al agregar los logaritmos es el mismo que al tomar el producto). Luego pregunta si esto es inusualmente bajo en comparación con lo que encontrarías con valores p aleatorios cuando la nula es verdadera (que serían extracciones de una distribución uniforme en ese caso).

En el producto, los valores muy pequeños "tiran hacia abajo" el valor más de lo que los valores muy grandes lo empujan hacia arriba (en comparación con un valor típico). Una probabilidad grande no puede ser superior a 1, pero una pequeña puede ser muy pequeña de hecho.

Según esa métrica de producto, un producto de muchos 0,5 es inusual en comparación con un producto de valores uniformes aleatorios. Si tus resultados realmente no mostraran nada, deberías ver algunos p pequeños ahí, pero no tienes ninguno. Al recolectar muchos 0,5 básicamente te estás adentrando en el territorio de 'aún menos discrepante que la aleatoriedad' ... lo que por supuesto no te llevaría a rechazarlo.

introducir descripción de la imagen aquí

El histograma es del valor p combinado de Fisher para una muestra de 1000 conjuntos de 10 valores p aleatorios (uniformes), la curva verde es la densidad real, la de un \chi^2_{20}, mientras que la línea marrón marca la posición para el valor p combinado cuando hay 10 valores, cada uno con p=0.5.

Observa que los valores grandes - valores en la cola derecha - son altamente significativos. El conjunto de diez valores 0.5 está bien dentro de la cola izquierda, por lo que no indican significancia.

Aunque el método de Fisher tiene mucho que recomendar (no menos importante es que tiene mucho sentido intuitivo trabajar con un producto de valores p independientes), en realidad no hay nada sagrado acerca de esa métrica. Por ejemplo, podrías sumar valores p y comparar esa suma con la distribución de una suma de valores p aleatorios. Por esa métrica, muchos p=0.5 te darían un valor justo en el medio. (Existen muchas otras formas en las que se pueden combinar los valores p. Principalmente yo solo sigo con Fisher, aunque generalmente captura lo que quiero que un "valor p combinado" capture).

3voto

John with waffle Puntos 3472

Un valor p de 0.5 no es el "valor p más insignificante". Indica que si la hipótesis nula es cierta, entonces el 50% del tiempo esperarías un resultado que sea al menos tan extremo como el resultado observado. Podrías llamar a eso un resultado "típico" bajo la hipótesis nula, pero ciertamente no "más insignificante". Un valor p de 1 sería el "valor p más insignificante".

2 votos

Combinar valores P generalmente implica el uso de valores P de una cola, por lo que p = 0.5 es lo que obtienes cuando los datos están en máximo acuerdo con la hipótesis nula. ("Más insignificante" es una descripción terrible).

0 votos

@MichaelLew ¿Estás pensando en pruebas de dos colas? Supongamos que estás interesado en la prueba de \mathcal{H}_0: \mu \le 0 y simulas 100 realizaciones de X \sim \mathcal{N}(-3, 1) Escribo t.test(x = rnorm(100, -3, 1), alternative = 'greater', mu = 0) y obtengo p \approx 1 lo cual tiene sentido intuitivamente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X