39 votos

Justificación de las pruebas de hipótesis de una cola

Entiendo las pruebas de hipótesis de dos colas. Usted tiene $H_0 : \theta = \theta_0$ (vs. $H_1 = \neg H_0 : \theta \ne \theta_0$ ). El $p$ -es la probabilidad de que $\theta$ genera datos al menos tan extremos como los observados.

No entiendo las pruebas de hipótesis de una cola. Aquí, $H_0 : \theta\le\theta_0$ (vs. $H_1 = \neg H_0 : \theta > \theta_0$ ). La definición de valor p no debería haber cambiado respecto a la anterior: debería seguir siendo la probabilidad de que $\theta$ genera datos al menos tan extremos como los observados. Pero no conozca $\theta$ sólo que está limitada superiormente por $\theta_0$ .

Así que en su lugar, veo textos que nos dicen que asumamos que $\theta = \theta_0$ (no $\theta \le \theta_0$ según $H_0$ ) y calcular la probabilidad de que esto genere datos al menos tan extremos como los observados, pero sólo en un extremo. Esto parece no tener nada que ver con las hipótesis, técnicamente.

Ahora bien, entiendo que esto es una prueba de hipótesis frecuentista, y que los frecuentistas no ponen ningún tipo de prejuicio en sus $\theta$ s. Pero, ¿no debería eso significar simplemente que las hipótesis son entonces imposibles de aceptar o rechazar, en lugar de meter con calzador el cálculo anterior?

37voto

jldugger Puntos 7490

Es una pregunta reflexiva. Muchos textos (quizás por razones pedagógicas) pasan por alto esta cuestión. Lo que realmente ocurre es que $H_0$ es un compuesto "hipótesis" en su situación unilateral: en realidad es un conjunto de hipótesis, no una sola. Es necesario que para cada hipótesis posible en $H_0$ la probabilidad de que la estadística de la prueba caiga en la región crítica debe ser menor o igual que el tamaño de la prueba. Además, si la prueba va a alcanzar realmente su tamaño nominal (lo que es bueno para lograr una alta potencia), entonces la suma de estas probabilidades (tomadas sobre todas las hipótesis nulas) debe ser igual al tamaño nominal. En la práctica, para las pruebas simples de localización de un parámetro que implican ciertas familias "agradables" de distribuciones, este supremum se alcanza para la hipótesis con parámetro $\theta_0$ . Por lo tanto, en la práctica, todo el cómputo se centra en esta única distribución. Pero no debemos olvidar el resto del conjunto $H_0$ Es una distinción crucial entre las pruebas de dos caras y las de una cara (y entre las pruebas "simples" y las "compuestas" en general).

Esto influye sutilmente en la interpretación de los resultados de las pruebas unilaterales. Cuando se rechaza el nulo, podemos decir que las pruebas apuntan en contra de que el verdadero estado de la naturaleza sea cualquiera de las distribuciones en $H_0$ . Cuando no se rechaza el nulo, sólo podemos decir existe una distribución en $H_0$ que es "consistente" con los datos observados. Estamos no diciendo que todo distribuciones en $H_0$ son coherentes con los datos: ¡ni mucho menos! Muchos de ellos pueden arrojar probabilidades extremadamente bajas.

6voto

Akira Puntos 1061

Veo el $p$ -valor como el máximo probabilidad de un error de tipo I. Si $\theta \ll \theta_0$ La probabilidad de que se produzca un error de tipo I puede ser efectivamente nula, pero que así sea. Cuando se mira la prueba desde una perspectiva minimax, un adversario nunca sacaría nada del "interior" de la hipótesis nula de todos modos, y la potencia no debería verse afectada. En situaciones sencillas (el $t$ -por ejemplo) es posible construir una prueba con una tasa de tipo I máxima garantizada, permitiendo tales hipótesis nulas unilaterales.

2voto

Factor Mystic Puntos 12465

Se utilizará una prueba de hipótesis unilateral si sólo los resultados en una dirección apoyan la conclusión a la que se intenta llegar.

Piense en esto en términos de la pregunta que está haciendo. Supongamos, por ejemplo, que quiere ver si la obesidad conlleva un mayor riesgo de infarto. Reúne sus datos, que podrían consistir en 10 personas obesas y 10 no obesas. Supongamos que, debido a factores de confusión no registrados, a un diseño experimental deficiente o simplemente a la mala suerte, observa que sólo 2 de las 10 personas obesas sufren ataques cardíacos, en comparación con 8 de las no obesas.

Ahora bien, si se realizara una prueba de hipótesis de dos caras con estos datos, se concluiría que existe una asociación estadísticamente significativa (p ~ 0,02) entre la obesidad y el riesgo de infarto. Sin embargo, la asociación estaría en el frente a dirección a la que realmente esperaba ver, por lo que el resultado de la prueba sería engañoso.

(En la vida real, un experimento que produjera un resultado tan contrario a la intuición podría dar lugar a otras cuestiones que son interesantes en sí mismas: por ejemplo, podría ser necesario mejorar el proceso de recogida de datos, o podría haber factores de riesgo previamente desconocidos en el trabajo, o tal vez la sabiduría convencional es simplemente errónea. Pero estas cuestiones no están realmente relacionadas con la estrecha cuestión de qué tipo de prueba de hipótesis utilizar).

2voto

Dan Puntos 12178

El $p$ -El valor es la probabilidad del evento respectivo con la condición de que $H_0$ es cierto . El ejemplo más sencillo de un juguete es el lanzamiento de dos monedas. Las dos caras $H_0$ sería que se considera que la moneda es justa, es decir, que se lanza una cara y una cola. La probabilidad para ello es $0.5$ . $H_1$ en este caso es que lo consideres sesgado hacia un lado o hacia otro, es decir, que saques dos caras o dos colas. La probabilidad vuelve a ser $0.5$

Para una cara $H_0$ Piensa en un juego en el que se pone el dinero a cara o cruz. Te parece bien que la moneda sea justa pero, por supuesto, también te parece bien que esté inclinada hacia la cara. Esta es su $H_0$ donde tienes las posibilidades de una cabeza y una cola o dos cabezas: $0.75$ probabilidad. $H_1$ es sólo el caso restante de dos colas en el que se llamaría falta: $0.25$ probabilidad. Tenga en cuenta que debido a que usted considera toda la región de justo a ser sesgada hacia las cabezas como su defecto dos colas debe ser considerado mucho más improbable y aún más sugestivo de que algo no está en orden.

Ahora bien, cuando los acontecimientos de nuestro $H_1$ Sin embargo, sus probabilidades son los valores p con la condición de que los respectivos $H_0$ son verdaderos - como se ha señalado anteriormente. Así que dependiendo de su nivel de confianza puede o no rechazar su $H_0$ 's.

Puedes experimentar con este ejemplo de juguete en R tú mismo, también deberías probar con diferentes números absolutos y combinaciones de cara y cruz:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X