17 votos

Alta varianza de la distribución de los valores de p (un argumento en Taleb 2016)

Estoy tratando de comprender el panorama reclamación hecha en Taleb, 2016, La Meta-Distribución de Estándar P-Valores.

En ella, Taleb hace el siguiente argumento de la falta de fiabilidad de la p-valor (como yo lo entiendo):

Un procedimiento de estimación operativo en $n$ puntos de datos procedentes de algunos de distribución de $X$ salidas de un p-valor. Si nos basamos n más puntos de distribución y de salida para el nuevo valor de p, podemos promedio de estos valores de p de obtener en el límite de la llamada "true p-valor".

Este "verdadero valor de p" está demostrado que tienen una forma preocupantemente alta varianza, por lo que una distribución+procedimiento con "el verdadero valor de p" $.12$ a 60% del tiempo de informe un valor de p <.05.

Pregunta: ¿cómo puede ser reconciliado con el tradicional argumento en favor de las $p$-valor. Como yo lo entiendo, el valor de p debe decirle a usted qué porcentaje de tiempo que el procedimiento le dará el intervalo correcto (o lo que sea). Sin embargo, este papel parece argumentar que esta interpretación es engañosa, ya que el p-valor no será el mismo si se ejecuta de nuevo el procedimiento.

Me estoy perdiendo el punto?

13voto

AdamSane Puntos 1825

Un p-valor es una variable aleatoria.

En $H_0$ (al menos de una forma continua distribuida de estadística), el valor de p debe tener una distribución uniforme

Para una prueba consistente, en $H_1$ el valor de p debe ir a 0 en el límite de la muestra aumento de tamaño hacia el infinito. Del mismo modo, como efecto de aumentar el tamaño de las distribuciones de los valores de p debe también tienden cambio hacia 0, pero siempre será "spread".

La noción de un "verdadero" valor de p suena como una tontería para mí. Qué significaría, ya sea en virtud de $H_0$ o $H_1$? Usted podría, por ejemplo, decir que quieres decir con "la media de la distribución de los valores de p en algún dado el tamaño del efecto y el tamaño de la muestra", pero entonces ¿en qué sentido ha de convergencia donde la propagación debe reducir? No es como usted puede aumentar el tamaño de la muestra mientras se mantenga constante.

He aquí un ejemplo con una muestra de un t-test y un pequeño tamaño del efecto bajo $H_1$. Los valores de p son casi uniforme cuando el tamaño de la muestra es pequeño, y la distribución lentamente se concentra hacia el 1 como el tamaño de la muestra aumenta.

enter image description here

Esto es exactamente cómo los valores de p se supone que se comportan - para una nula falsa, como el tamaño de la muestra aumenta, los valores de p debe ser más concentrada en los valores bajos, pero no hay nada que sugieren que la distribución de los valores que toma cuando usted comete un error de tipo II - cuando el p-valor está por encima de cualquiera que sea su nivel de significación es - de alguna manera debe terminar en "cerrar" para que el nivel de significación.

Entonces, ¿qué sería de un p-valor de ser una estimación de? No es que la convergencia hacia algo (distinto de 0). No está del todo claro el por qué de que uno esperaría de un p-valor de tener baja varianza en cualquier lugar, pero a medida que se aproxima a 0, incluso cuando la potencia es bastante buena (por ejemplo, para $\alpha=0.05$, la potencia en el n=1000 caso hay cerca de 57%, pero aún así es perfectamente posible obtener un p-valor de camino hasta cerca de 1)

Muchas veces es útil considerar lo que sucede tanto con la distribución de cualquier prueba estadística se usa en la alternativa y lo que la aplicación de la cdf bajo el nulo como una transformación que va a hacer a la distribución (que dará a la distribución de la p-valor en la alternativa específica). Cuando se piensa en estos términos a menudo no es difícil ver por qué el comportamiento es como es.

El problema como yo lo veo no es tanto que no hay ningún problema inherente con p-valores o la prueba de hipótesis, es más un caso de si la prueba de hipótesis es una buena herramienta para su problema en particular o si algo más, sería más apropiado en cualquier caso, que no es una situación para ponerlos a la polémica, pero uno de una cuidadosa consideración de la clase de preguntas que las pruebas de hipótesis de dirección y las necesidades particulares de su circunstancia. Por desgracia, de una cuidadosa consideración de estas cuestiones se hacen raramente -- todos demasiado a menudo uno ve a una pregunta del tipo "¿qué pruebas debo utilizar para estos datos?", sin ninguna consideración de lo que la pregunta de interés, y no digamos si alguna prueba de hipótesis es una buena manera de abordarlo.

Una de las dificultades es que las pruebas de hipótesis son ampliamente incomprendido y ampliamente utilizada indebidamente; personas que piensan muy a menudo nos dicen que las cosas que ellos no. El p-valor es posiblemente el más incomprendido cosa acerca de las pruebas de hipótesis.

11voto

jsakaluk Puntos 544

Glen_b la respuesta es irregular en el (+1; considerar la mina complementario). El papel de referencia por Taleb es tópica, muy similar a una serie de papeles dentro de la psicología y de las estadísticas de la literatura acerca de qué tipo de información que puede obtener del análisis de las distribuciones de los valores de p (lo que los autores llaman p-curva; véase su sitio con un montón de recursos, incluyendo un p-análisis de la curva de la aplicación aquí).

Los autores proponen dos usos principales de p de la curva:

  1. Se puede apreciar el valor probatorio de una literatura, mediante el análisis de la literatura del p de la curva. Esta fue su primera publicidad uso de p de la curva. Esencialmente, como Glen_b describe, cuando usted está tratando con los no-cero de los tamaños del efecto, usted debe ver p-curvas que están positivamente sesgada por debajo de la convencional umbral de p < .05, como las de los pequeños valores de p debe ser más propensos que los p-valores cercanos a p = .05 cuando un efecto (o grupo de efectos) son "reales". Por lo tanto puede probar una p de la curva para un importante sesgo positivo, como una prueba de valor probatorio. Por el contrario, los desarrolladores proponen que usted puede realizar una prueba de asimetría negativa (es decir, más frontera significativa p-valuesthan más pequeños) como una forma de comprobar si un determinado conjunto de efectos ha sido objeto de varias cuestionable de la analítica de las prácticas.
  2. Se puede calcular una publicación libre de sesgo meta-analítica de la estimación del tamaño del efecto con p de la curva con los publicados en otras p-valores. Este es un poco más complicado de explicar sucintamente, y en lugar de eso, me gustaría recomendar que usted echa un vistazo a su efecto de tamaño de estimación centrado papeles (Simonsohn, Nelson, & Simmons, 2014a, 2014b) y leer sobre los métodos de sí mismo. Pero, esencialmente, los autores sugieren que la p de la curva puede ser utilizado para eludir el problema de la archivo-cajón efecto, cuando la realización de un meta-análisis.

Así, en cuanto a su pregunta más amplia:

cómo puede ser reconciliado con el tradicional argumento en favor de la p-valor?

Yo diría que métodos como Taleb (y otros) han encontrado una manera de cambiar la finalidad de los valores de p, de modo que podemos obtener información útil acerca de toda la literatura mediante el análisis de los grupos de valores de p, mientras que un p-valor en sí mismo, podría ser mucho más limitado en cuanto a su utilidad.

Referencias

Simonsohn, U., Nelson, L. D., & Simmons, J. P. (2014a). P-curva: Una Clave Para El Cajón de Archivo. Journal of Experimental Psychology: General, 143, 534-547.

Simonsohn, U., Nelson, L. D., & Simmons, J. P. (2014b). P de la Curva y el Tamaño del Efecto: la Corrección de Sesgo de Publicación Utilizando Sólo Resultados Significativos. Perspectivas de la Ciencia Psicológica, 9, 666-681.

Simonsohn, U., Simmons, J. P., & Nelson, L. D. (2015). Mejor P-curvas: Hacer P-análisis de la curva más robusto a errores, fraude, y los ambiciosos P-hacking, una Respuesta a Ulrich y Miller (2015).Journal of Experimental Psychology: General, 144, 1146-1152.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X