A menudo en frecuentista la prueba de hipótesis, la hipótesis nula es de la forma: $H_0: \theta = 0$
He visto muchos posts acerca de cómo el valor de p cuando haciendo pruebas en contra de esta hipótesis nula es sólo una medida de la muestra de tamaño en cierto sentido, ya que en realidad theta casi nunca es exactamente 0, así que, dado que los puntos de datos suficientes el p-valor converge a 0.
Entonces, ¿por qué existe todo esto se centran en que la simple hipótesis nula si casi siempre se sabe a priori que $\theta \neq 0$?
Parece muy intuitiva en la que el valor null debería ser algo más parecido a: $H_0: |\theta| < \epsilon$, para algunas de las $\epsilon$. Incluso si $\epsilon$ es pequeña, esto ya se parece mucho más a prueba aplicable a datos reales.
He estado aprendiendo acerca de las pruebas a/B y no he visto el concepto de equivalencia de pruebas, sin embargo, parece muy natural el concepto a utilizar en ese entorno? ¿Hay algún error en esta metodología de que me estoy perdiendo / ¿hay alguna razón para preferir la prueba: $H_0: \theta = 0$?
edit: encontré un relevante comentario por Keith Winstein de otro hilo (citado más abajo): Son grandes conjuntos de datos inapropiados para la prueba de hipótesis?
La simple hipótesis de que un físico de la moneda ha jefes de probabilidad exactamente igual a 0.5, ok, eso es falso.
Pero el compuesto hipótesis de que un físico de la moneda ha jefes de probabilidad mayor que 0.499 y menos de 0.501 puede ser cierto. Si es así, no prueba de hipótesis-no importa cómo muchos de los coin flips entrar en ella-es va a ser capaz de rechazar esta hipótesis con una probabilidad mayor de αα (las pruebas del obligado en los falsos positivos).
La industria médica, pruebas de "no inferioridad" hipótesis todo el tiempo, por esta razón-por ejemplo, un nuevo medicamento para el cáncer tiene que demostrar que su los pacientes probabilidad de supervivencia libre de progresión no menos de 3 porcentaje de puntos inferior a la de un medicamento existente, en algunos confianza nivel (el αα, generalmente 0.05).
De nuevo, hace perfecto sentido. ¿Cuál es el punto de prueba de algo como la "probabilidad igual a 0.5" cuando ya sabemos que es falso ({0.5} es un conjunto de medida 0)? Sin embargo, veo a este hecho 1000000x más de las pruebas de compuesto hipótesis como Keith describe. Las únicas cosas que he descubierto acerca de la no-inferioridad de pruebas han sido en la literatura médica. Incluso no recuerdo el aprendizaje acerca de ello en la introducción de las estadísticas de los cursos aunque es muy intuitivo concepto. No es más ampliamente aplicable?