Johansson (2011) en "el Granizo lo imposible: los valores de p, la evidencia, y la probabilidad" (aquí también el enlace a la revista) los estados que menor $p$-valores son a menudo considerados como la evidencia más fuerte en contra de la anulación. Johansson implica que la gente podría considerar la evidencia en contra de la nula para ser más fuerte si su prueba estadística emite un $p$-valor de $0.01$, que si su prueba estadística emite un $p$-valor de $0.45$. Johansson enumera cuatro razones por las que el $p$-valor no puede ser utilizado como evidencia en contra de la nula:
- $p$ es uniformemente distribuido bajo la hipótesis nula y, por tanto, nunca indican evidencia de la nulos.
- $p$ es condicionado únicamente en la hipótesis nula y por lo tanto inadecuado para cuantificar la evidencia, porque la evidencia es siempre relativa en el sentido de que se evidencia en favor o en contra de una hipótesis en relación a otra hipótesis.
- $p$ designa la probabilidad de obtención de pruebas (dada la nula), en lugar de la fuerza de la evidencia.
- $p$ depende de datos observados y las intenciones subjetivas y, por tanto, implica, dada la prueba de interpretación, que la prueba la fuerza de los datos observados depende de las cosas que no suceder y las intenciones subjetivas.
Por desgracia no puedo obtener una comprensión intuitiva de Johansson artículo. Para mí, un $p$-valor de $0.01$ indica que hay menos posibilidades de nula es verdadera, de un $p$-valor de $0.45$. ¿Por qué son menores de $p$-valores no más fuerte evidencia en contra de null?