He estado leyendo Geoff Cumming del papel de 2008 Replicación y $p$ Intervalos: $p$ valores de predecir el futuro sólo vagamente, pero los intervalos de confianza mucho mejor -- y estoy confundido por uno de sus reclamos. Este es uno de la serie de documentos donde Cumming argumenta en contra de las $p$-los valores de y en favor de los intervalos de confianza; mi pregunta es, sin embargo, no acerca de este debate y sólo se refiere a una demanda específica acerca de la $p$-valores. [Nota de que Cumming es bien conocido y de que el papel ha ~200 citas en Google Scholar: esto no es un "oscuro" de papel.]
Permítanme citar el resumen:
En este artículo se muestra que, si una inicial los resultados del experimento en dos colas $p= .05$, hay un $80\%$ posibilidad de que el de una cola $p$-valor de una replicación caerá en el intervalo de $(.00008, .44)$ $10\%$ de probabilidad de que $p < .00008$, y un $10\%$ de probabilidad de que $p > .44$. Sorprendentemente, el intervalo-que se llama un $p$ intervalo-este es amplia, sin embargo, amplias el tamaño de la muestra.
Cumming afirma que esta "$p$ intervalo", y de hecho toda la distribución de $p$-valores que se obtendría al replicar el experimento original (con el mismo tamaño de muestra fijo), se basan sólo en el original $p$valor $p_\mathrm{obt}$ y no dependen de que el verdadero efecto del tamaño, la potencia, el tamaño de la muestra, o cualquier otra cosa:
[...] la distribución de probabilidad de $p$ se puede derivar sin sabiendo o suponiendo un valor de $\delta$ (o poder). [...] No asumimos ningún tipo de conocimiento previo acerca de $\delta$, y sólo utilizamos la información $M_\mathrm{diff}$ [observada entre el grupo de diferencia] da acerca de $\delta$ la base para el cálculo para un determinado $p_\mathrm{obt}$ de la distribución de $p$ e de $p$ intervalos.
Estoy confundido por esto, porque a mí me parece que la distribución de $p$-valores depende fuertemente de energía, mientras que el original $p_\mathrm{obt}$ sobre su propio no da ninguna información sobre ella. Podría ser que el verdadero tamaño del efecto es $\delta=0$ y, a continuación, la distribución es uniforme; o tal vez el verdadero tamaño del efecto es enorme y debemos esperar que en su mayoría muy pequeñas $p$-valores. Por supuesto, uno puede comenzar con la hipótesis previa sobre el posible efecto de los tamaños y de integrar, pero Cumming parece alegar que esto no es lo que él está haciendo.
Pregunta: ¿exactamente Qué está pasando aquí?
Todo parece estar explicado en el propio documento y en su Anexo, pero hasta ahora he sido incapaz de entender y pensé que esto es lo suficientemente interesante como para plantear esta cuestión aquí para la discusión.
Tenga en cuenta que este tema se relaciona con esta pregunta: ¿Qué fracción de la repetición de experimentos tendrá un tamaño del efecto en el 95% de intervalo de confianza del primer experimento? donde yo recomiendo a todo el mundo a upvote @whuber la respuesta; Cumming tiene otro artículo acerca de la replicación y de la Cei: Cumming & Maillardet, 2006, Intervalos de Confianza y la Replicación: ¿Dónde Será la Próxima Media Otoño? - pero que uno es claro y no se me confundan.
Yo también tenga en cuenta que Cumming reclamación se repite varias veces en el año 2015 la Naturaleza de los Métodos de papel El spot $P$ valor genera resultados irreproducibles que algunos de ustedes podrían haber llegado a través de [ya ha ~100 citas en Google Scholar]:
[...] habrá una considerable variación en el $P$ valor de la repetición de experimentos. En realidad, los experimentos que rara vez se repite; no sabemos cómo es diferente la próxima $P$ podría ser. Pero es probable que podría ser muy diferente. Por ejemplo, independientemente de la potencia estadística de un experimento, si una sola replicar devuelve un $P$ valor de $0.05$, hay un $80\%$ de probabilidad de que se repita el experimento volvería a $P$ valor entre el $0$ $0.44$ (y un $20\%$ cambio [sic] que $P$ serían aún mayores).
(Nota, por cierto, ¿cómo, independientemente de si Cumming de la declaración es correcta o no, la Naturaleza de los Métodos papel cita erróneamente: de acuerdo a Cumming, sólo se $10\%$ de probabilidad por encima de $0.44$. Y sí, el papel dice "20% change". Debo añadir que no me gusta este trabajo?)