La frase "... pruebas para rechazar $H_0$ " no tiene mucho sentido para mí porque o bien rechazas $H_0$ cuando $p\leq\alpha$ o no. Es tu decisión rechazar o no rechazar. El "rechazo" no es una propiedad inherente al $p$ -valor porque requiere un criterio adicional establecido por el investigador.
Lo que tiene más sentido es hablar de la pruebas contra la hipótesis nula proporcionada por el $p$ -valor. Si adoptamos el punto de vista $^{[1,2]}$ que el $p$ -valor es un continuo medida de compatibilidad entre nuestros datos y el modelo (incluida la hipótesis nula), tiene sentido hablar de varios grados de evidencia en contra de $H_0$ . Personalmente, me gusta el enfoque de Rafi & Greenland $^{[1]}$ para transformar el $p$ -valor en (Shannon) sorpresa como $s=-\log_2(p)$ (también conocida como información Shannon). Para un amplio debate sobre la distinción de $p$ -valores de decisión y $p$ -como medidas de compatibilidad, véase el reciente artículo de Greenland $^{[2]}$ . Esto proporciona una escala absoluta en la que ver la información que un $p$ -valor proporciona. Si el lanzamiento de una moneda proporciona $1$ de información, un $p$ -valor de, digamos, $0.05$ proporciona $s=-\log_2(0.05)=4.32$ bits de información contra la hipótesis nula. Dicho de otro modo: A $p$ -valor de $0.05$ es tan sorprendente como ver todas las caras en cuatro lanzamientos de una moneda.
Este enfoque deja muy claro que las pruebas aportadas por un $p$ -valor no es lineal. Por ejemplo: A $p$ -valores $0.10$ proporciona $3.32$ bits de información, mientras que un $p$ -valor de $0.15$ proporciona $2.74$ bits. Los primeros $p$ -Así pues, el valor $21$ % más pruebas contra $H_0$ como el segundo. En un segundo ejemplo, un $p$ -valor de $0.001$ proporciona aproximadamente $132$ % más pruebas que un $p$ -valor de $0.051$ a pesar de que la diferencia absoluta entre ellos es la misma que en el primer ejemplo ( $0.05$ ). He aquí una ilustración del papel $[1]$ :
Para responder a la pregunta: Mientras el $p$ -es inferior a $1$ establece algunos evidencia contra la hipótesis nula porque muestra algunos incompatibilidad entre los datos y el modelo. Por tanto, decir "no hay pruebas" no sería del todo exacto.
Referencias
$[1]$ : Rafi, Z., Greenland, S. Semantic and cognitive tools to aid statistical science: replace confidence and significance by compatibility and surprise. BMC Med Res Methodol 20, 244 (2020). https://doi.org/10.1186/s12874-020-01105-9
$[2]$ : Groenlandia, S. (2023). Divergencia frente a valores P de decisión: Una distinción que vale la pena hacer en teoría y mantener en la práctica: Or, how divergence P-values measure evidence even when decision P-values do not. Scand J Statist, 50( 1), 54- 88. https://doi.org/10.1111/sjos.12625