Respuesta a la pregunta 1: Esto ocurre porque el $p$ -El valor se vuelve arbitrariamente pequeño a medida que aumenta el tamaño de la muestra en las pruebas frecuentistas de diferencia (es decir, pruebas con una hipótesis nula de no diferencia/alguna forma de igualdad) cuando una diferencia verdadera exactamente igual a cero en lugar de estar arbitrariamente cerca de cero, no es realista (véase el comentario de Nick Stauner a la OP). El $p$ -se vuelve arbitrariamente pequeño porque el error de las pruebas estadísticas frecuentistas generalmente disminuye con el tamaño de la muestra, con el resultado de que todas las diferencias son significativas a un nivel arbitrario con un tamaño de muestra suficientemente grande . Cosma Shalizi ha escribió eruditamente sobre esto .
Respuesta a la pregunta 2: Dentro de un marco de pruebas de hipótesis frecuentista, uno puede protegerse de esto mediante no hacer inferencia sólo para detectar la diferencia . Por ejemplo, se puede combinar inferencias sobre diferencia y equivalencia para no favorecer (¡o confundir!) la carga de la prueba sobre evidencia del efecto frente a pruebas de la ausencia de efecto . Las pruebas de la ausencia de un efecto provienen, por ejemplo, de
- dos pruebas unilaterales de equivalencia (TOST),
- pruebas de equivalencia uniformemente más potentes y
- el enfoque del intervalo de confianza para la equivalencia (es decir, si el $1-2\alpha$ El %CI de la estadística de la prueba es en el a priori -de equivalencia/relevancia, entonces se concluye la equivalencia en el $\alpha$ nivel de significación).
Lo que todos estos enfoques comparten es un a priori decisión sobre el tamaño del efecto que constituye un diferencia relevante y una hipótesis nula formulada en términos de una diferencia al menos tan grande como lo que se considera relevante.
La inferencia combinada de pruebas de diferencia y pruebas de equivalencia protege así contra el sesgo que usted describe cuando los tamaños de las muestras son grandes (tabla de dos por dos que muestra las cuatro posibilidades resultantes de las pruebas combinadas de diferencia-hipótesis nula positivista, $\text{H}_{0}^{+}$ -y la hipótesis nula de equivalencia-negativa, $\text{H}_{0}^{-}$ ):
![Four possibilities from combined tests for difference and tests for equivalence]()
Fíjese en el cuadrante superior izquierdo: una prueba con exceso de potencia es aquella en la que sí se rechaza la hipótesis nula de ausencia de diferencia, pero también se rechaza la hipótesis nula de diferencia relevante, por lo que sí hay diferencia, pero se tiene a priori decidió que no le importa porque es demasiado pequeño.
Respuesta a la pregunta 3: Véase la respuesta a la pregunta 2.