16 votos

Cómo especificar la hipótesis nula en las pruebas de hipótesis

¿Cuál es una buena regla general para elegir la pregunta de la hipótesis nula? Por ejemplo, si quiero comprobar si la hipótesis B es verdadera, ¿debo utilizar B como hipótesis nula, B como hipótesis alternativa o NO B como nula? Espero que la pregunta esté clara. Sé que tiene que ver con el error que quiero minimizar (¿tipo I?), pero se me olvida cómo va, porque no tengo una intuición clara construida para ello. Gracias.

17voto

Xenph Yan Puntos 20883

Una regla general de un buen asesor mío era establecer la hipótesis nula en el resultado que no quieres que sea cierto, es decir, el resultado cuyo opuesto directo quieres mostrar.

Ejemplo básico: Supongamos que ha desarrollado un nuevo tratamiento médico y quiere demostrar que efectivamente es mejor que el placebo. Así que establece la hipótesis nula $H_0:=$ el nuevo tratamiento es igual o peor que el placebo e hipótesis alternativa $H_1:=$ el nuevo tratamiento es mejor que el placebo.

Esto se debe a que, en el curso de una prueba estadística, o bien se rechaza la hipótesis nula (y se favorece la hipótesis alternativa) o no se puede rechazar. Dado que su "objetivo" es rechazar la hipótesis nula, la fija en el resultado que no quiere que sea cierto.

Nota al margen: Soy consciente de que no se debe montar una prueba estadística para retorcerla y romperla hasta que se rechace la hipótesis nula, el lenguaje informal sólo se utilizó para hacer esta regla más fácil de recordar.

Esto también puede ser útil: ¿Qué significan los valores p y t en las pruebas estadísticas? y/o ¿Cuál es una buena introducción a las pruebas de hipótesis estadísticas para los informáticos?

6voto

Nathan Long Puntos 30303

Si la hipótesis B es la hipótesis interesante se puede tomar no-B como la hipótesis nula y controlar, bajo la nula, la probabilidad del error de tipo I por rechazar erróneamente no-B al nivel $\alpha$ . Rechazar no-B se interpreta entonces como una evidencia a favor de B porque controlamos el error de tipo I, por lo que es poco probable que no-B sea cierto. ¿Confuso?

Tomemos el ejemplo del tratamiento frente al no tratamiento en dos grupos de una población. La hipótesis interesante es que el tratamiento tiene un efecto, es decir, que hay una diferencia entre el grupo tratado y el no tratado debido al tratamiento. La hipótesis nula es que hay no diferencia, y controlamos la probabilidad de rechazar erróneamente esta hipótesis. Así, controlamos la probabilidad de concluir erróneamente que hay un efecto del tratamiento cuando no lo hay. El error de tipo II es la probabilidad de aceptar erróneamente la nulidad cuando existe un efecto del tratamiento.

La formulación anterior se basa en el marco de Neyman-Pearson para las pruebas estadísticas, donde éstas se consideran un problema de decisión entre dos casos, el nulo y el alternativo. El nivel $\alpha$ es la fracción de veces que cometemos un error de tipo I si repetimos (independientemente) la prueba. En este marco no hay realmente ninguna distinción formal entre la nula y la alternativa. Si intercambiamos la nula y la alternativa, intercambiamos la probabilidad de errores de tipo I y de tipo II. Sin embargo, no controlamos la probabilidad de error de tipo II anteriormente (depende de lo grande que sea el efecto del tratamiento), y debido a esta asimetría, podemos preferir decir que no rechazar la hipótesis nula (en lugar de que aceptemos la hipótesis nula). Por lo tanto, debemos tener cuidado al concluir que la hipótesis nula es verdadera sólo porque no podemos rechazarla.

En un pescador pruebas de significación En realidad, sólo hay una hipótesis nula y se calcula, bajo la nula, un $p$ -para los datos observados. Más pequeño $p$ -Los valores se interpretan como una evidencia más fuerte contra la nulidad. Aquí la hipótesis nula es definitivamente no-B (ningún efecto del tratamiento) y el $p$ -El valor se interpreta como la cantidad de pruebas en contra de la nulidad. Con un valor $p$ -Podemos rechazar con confianza el valor nulo, que no hay efecto del tratamiento, y concluir que hay un efecto del tratamiento. En este marco sólo podemos rechazar o no rechazar (nunca aceptar) el nulo, y se trata de falsificar el nulo. Tenga en cuenta que el $p$ -valor no necesita ser justificado por un número repetido (imaginario) de decisiones.

Ninguno de los dos marcos está exento de problemas, y la terminología se confunde a menudo. Puedo recomendar el libro Pruebas estadísticas: un paradigma de probabilidad de Richard M. Royall para un tratamiento claro de los diferentes conceptos.

5voto

patfla Puntos 1

La respuesta "frecuentista" consiste en inventar una hipótesis nula de la forma "no B" y luego argumentar contra "no B", como en la respuesta de Steffen. Esto es el equivalente lógico de argumentar "Usted está equivocado, por lo tanto yo debo tener razón". Este es el tipo de razonamiento que utilizan los políticos (es decir, la otra parte es mala, por lo tanto nosotros somos buenos). Es bastante difícil manejar más de una alternativa bajo este tipo de razonamiento. Esto se debe a que ese argumento de "tú estás equivocado, por lo tanto yo tengo razón" sólo tiene sentido cuando no es posible que ambos estén equivocados, lo que ciertamente puede ocurrir cuando hay más de una hipótesis alternativa.

La respuesta "bayesiana" consiste simplemente en calcular la probabilidad de la hipótesis que te interesa comprobar, condicionada a las pruebas que tengas. Siempre contiene información previa, que no es más que los supuestos que has hecho para que tu problema esté bien planteado (todos los procedimientos estadísticos se basan en información previa, los bayesianos sólo los hacen más explícitos). También suele consistir en algunos datos, y tenemos por teorema de bayes

$$P(H_{0}|DI)=\frac{P(H_{0}|I)P(D|H_{0}I)}{\sum_{k}P(H_{k}|I)P(D|H_{k}I)}$$

Esta forma es independiente de lo que se denomina "nulo" y lo que se denomina "alternativo", porque hay que calcular exactamente las mismas cantidades para cada hipótesis que se vaya a considerar: el previo y la probabilidad. Esto es, en cierto sentido, análogo al cálculo de las tasas de error "tipo 1" y "tipo 2" en las pruebas de hipótesis de Neyman Pearson, simplemente porque una tasa de error "tipo 2" cuando $H_0$ es el "nulo" es lo mismo que la tasa de error "tipo 1" con $H_0$ es la "alternativa". Son sólo las connotaciones que implican las palabras "nulo" y "alternativo" las que las hacen parecer diferentes. Se puede demostrar la equivalencia en el caso del "Lemma de Neyman Pearson" cuando hay dos hipótesis, ya que se trata simplemente de la razón de verosimilitud, que se da de una vez tomando las probabilidades del teorema de bayes anterior:

$$\frac{P(H_{0}|DI)}{P(H_{1}|DI)}=\frac{P(H_{0}|I)}{P(H_{1}|I)}\times\frac{P(D|H_{0}I)}{P(D|H_{1}I)}=\frac{P(H_{0}|I)}{P(H_{1}|I)}\times\Lambda$$

Así que los problemas de decisión son los mismos: aceptar $H_0$ cuando $\Lambda > \tilde{\Lambda}$ para algún punto de corte $\tilde{\Lambda}$ y aceptar $H_1$ de lo contrario. Así pues, los procedimientos son básicamente diferentes en cuanto a la elección del valor de corte, o límite de decisión. Los "bayesianos" dirían que debería ser el producto de las probabilidades previas por la proporción de pérdidas $\frac{L_2}{L_1}$ donde $L_1$ es la "pérdida por error de tipo 1" y $L_2$ es la "pérdida por error de tipo 2". Se trata de pérdidas, no de probabilidades, que describen la gravedad relativa de cometer cada uno de los dos errores. El criterio frecuentista consiste en minimizar una de las tasas medias de error, de tipo 1 o 2, manteniendo la otra fija. Pero como conducen a la misma forma de límite de decisión, siempre podemos encontrar una proporción bayesiana a priori*pérdida equivalente para cada tasa de error minimizada por los frecuentistas.

En resumen, si se utiliza el cociente de probabilidad para probar la hipótesis, no importa cómo se llame la hipótesis nula. Cambiar la nula por la alternativa sólo cambia la decisión de $\Lambda^{-1}<\tilde{\Lambda}^{-1}$ que es matemáticamente lo mismo (tomará la misma decisión, pero basada en el corte de chi-cuadrado inverso en lugar de chi-cuadrado para su valor p). El juego de palabras con "no rechazar el nulo" no se aplica a la prueba de hipótesis, porque es un decisión Si sólo hay dos opciones, entonces "no rechazar el nulo" significa lo mismo que "aceptar el nulo".

1voto

Compile This Puntos 4684

La hipótesis nula debe suponer, en general, que las diferencias en una variable de respuesta se deben únicamente al error.

Por ejemplo, si quiere probar el efecto de algún factor A sobre la respuesta x entonces el nulo sería: $H_0$ = No hay efecto de A sobre la respuesta x .

No rechazar esta hipótesis nula se interpretaría como:

1) cualquier diferencia en x se deben únicamente a un error y no A o,

2) que los datos son inadecuados para detectar una diferencia aunque exista (véase el error de tipo 2 más adelante).

El rechazo de esta hipótesis nula se interpretaría como la hipótesis alternativa: $H_a$ = Hay un efecto de A sobre la respuesta x es cierto.

Los errores de tipo 1 y de tipo 2 están relacionados con el uso de la hipótesis nula, pero no con su designación real. El error de tipo 1 se produce cuando se rechaza $H_0$ aunque sea cierto - es decir, concluye incorrectamente un efecto de A en x cuando no existía. El error de tipo 2 se produce cuando no se rechaza el $H_0$ aunque sea falsa - es decir, concluye incorrectamente que no hay efecto de A en x aunque exista uno.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X