32 votos

¿Rechazar la hipótesis mediante el valor p equivale a que la hipótesis no pertenezca al intervalo de confianza?

Al derivar formalmente el intervalo de confianza de una estimación, terminé con una fórmula que se parece mucho a la forma $p$ -se calcula el valor.

De ahí la pregunta: ¿son formalmente equivalentes? Es decir, ¿se rechaza una hipótesis $H_0 = 0$ con un valor crítico $\alpha$ equivalente a $0$ que no pertenece al intervalo de confianza con valor crítico $\alpha$ ?

0 votos

Tal vez esto pueda ayudar: stats.stackexchange.com/questions/166478/

0 votos

En resumen: sí. En largo: véase el enlace de f_coppens.

0 votos

@StijnDeVuyst: bueno, yo no lo diría así, porque hay diferentes maneras de probar la hipótesis/construir el intervalo de confianza. Por ejemplo, para las proporciones tienes el intervalo de confianza 'Clopper/Pearson' y el intervalo de confianza 'Sterne', ambos son diferentes.

38voto

phloopy Puntos 4285

Sí y no.

Primero el "sí"

Lo que has observado es que cuando una prueba y un intervalo de confianza se basan en el mismo estadístico, existe una equivalencia entre ellos: podemos interpretar el $p$ -como el valor más pequeño de $\alpha$ para lo cual el valor nulo del parámetro se incluiría en el $1-\alpha$ intervalo de confianza.

Dejemos que $\theta$ sea un parámetro desconocido en el espacio de parámetros $\Theta\subseteq\mathbb{R}$ y que la muestra $\mathbf{x}=(x_1,\ldots,x_n)\in\mathcal{X}^ n\subseteq\mathbb{R}^n$ sea una realización de la variable aleatoria $\mathbf{X}=(X_1,\ldots,X_n)$ . Para simplificar, defina un intervalo de confianza $I_\alpha(\mathbf{X})$ como un intervalo aleatorio tal que su probabilidad de cobertura $$ P_\theta(\theta\in I_\alpha(\mathbf{X}))= 1-\alpha\qquad\mbox{for all }\alpha\in(0,1). $$ (También se pueden considerar intervalos más generales, en los que la probabilidad de cobertura está limitada por o es aproximadamente igual a $1-\alpha$ . El razonamiento es análogo).

Considere una prueba de dos caras de la hipótesis de punto nulo $H_0(\theta_0): \theta=\theta_0$ contra la alternativa $H_1(\theta_0): \theta\neq \theta_0$ . Sea $\lambda(\theta_0,\mathbf{x})$ denotan el valor p de la prueba. Para cualquier $\alpha\in(0,1)$ , $H_0(\theta_0)$ se rechaza en el nivel $\alpha$ si $\lambda(\theta_0,x)\leq\alpha$ . El nivel $\alpha$ región de rechazo es el conjunto de $\mathbf{x}$ lo que lleva al rechazo de $H_0(\theta_0)$ : $$ R_\alpha(\theta_0)=\{\mathbf{x}\in\mathbb{R}^n: \lambda(\theta_0,\mathbf{x})\leq\alpha\}.$$

Ahora, consideremos una familia de pruebas de dos caras con valores p $\lambda(\theta,\mathbf{x})$ , para $\theta\in\Theta$ . Para esta familia podemos definir un región de rechazo invertida $$ Q_\alpha(\mathbf{x})=\{\theta\in\Theta: \lambda(\theta,\mathbf{x})\leq\alpha\}.$$

Para cualquier $\theta_0$ , $H_0(\theta_0)$ se rechaza si $\mathbf{x}\in R_\alpha(\theta_0)$ lo que ocurre si y sólo si $\theta_0\in Q_\alpha(\mathbf{x})$ Es decir, $$ \mathbf{x}\in R_\alpha(\theta_0) \Leftrightarrow \theta_0\in Q_\alpha(\mathbf{x}). $$ Si la prueba se basa en una estadística de prueba con una distribución nula absolutamente continua completamente especificada, entonces $\lambda(\theta_0,\mathbf{X})\sim \mbox{U}(0,1)$ en $H_0(\theta_0)$ . Entonces $$ P_{\theta_0}(\mathbf{X}\in R_\alpha(\theta_0))=P_{\theta_0}(\lambda(\theta_0,\mathbf{X})\leq\alpha)=\alpha. $$ Como esta ecuación es válida para cualquier $\theta_0\in\Theta$ y como la ecuación anterior implica que $$P_{\theta_0}(\mathbf{X}\in R_\alpha(\theta_0))=P_{\theta_0}(\theta_0\in Q_\alpha(\mathbf{X})),$$ se deduce que el conjunto aleatorio $Q_\alpha(\mathbf{x})$ siempre cubre el parámetro verdadero $\theta_0$ con probabilidad $\alpha$ . En consecuencia, dejar que $Q_\alpha^C(\mathbf{x})$ denotan el complemento de $Q_\alpha(\mathbf{x})$ para todos $\theta_0\in\Theta$ tenemos $$P_{\theta_0}(\theta_0\in Q_\alpha^C(\mathbf{X}))=1-\alpha,$$ lo que significa que el complemento de la región de rechazo invertido es un $1-\alpha$ intervalo de confianza para $\theta$ .

A continuación se presenta una ilustración que muestra las regiones de rechazo y los intervalos de confianza correspondientes al $z$ -prueba para una media normal, para diferentes medias nulas $\theta$ y diferentes medias muestrales $\bar{x}$ con $\sigma=1$ . $H_0(\theta)$ se rechaza si $(\bar{x},\theta)$ está en la región sombreada de color gris claro. En gris oscuro se muestra la región de rechazo $R_{0.05}(-0.9)=(-\infty,-1.52)\cup(-0.281,\infty)$ y el intervalo de confianza $I_{0.05}(1/2)=Q_{0.05}^C(1/2)=(-0.120,1.120)$ . enter image description here

(Gran parte de esto está tomado de mi tesis doctoral .)

Ahora el "no"

Más arriba he descrito la forma estándar de construir intervalos de confianza. En este enfoque, utilizamos algún estadístico relacionado con el parámetro desconocido $\theta$ para construir el intervalo. También existen intervalos basados en algoritmos de minimización, que buscan minimizar la longitud de la condición del intervalo en el valor de $X$ . Normalmente, estos intervalos no corresponden a una prueba.

Este fenómeno tiene que ver con los problemas relacionados con que dichos intervalos no están anidados, lo que significa que el intervalo del 94 % puede ser más corto que el del 95 %. Para más información sobre este tema, véase el apartado 2.5 de este un documento mío reciente (que aparecerá en Bernoulli).

Y un segundo "no"

En algunos problemas, el intervalo de confianza estándar no se basa en el mismo estadístico que la prueba estándar (tal y como analiza Michael Fay en este documento ). En esos casos, los intervalos de confianza y las pruebas pueden no dar los mismos resultados. Por ejemplo, $\theta_0=0$ puede ser rechazado por la prueba aunque se incluya 0 en el intervalo de confianza. Esto no contradice el "sí" anterior, ya que se utilizan estadísticas diferentes.

Y a veces el "sí" no es algo bueno

Como señala f coppens en un comentario, a veces los intervalos y las pruebas tienen objetivos algo contradictorios. Queremos intervalos cortos y pruebas con alta potencia, pero el intervalo más corto no siempre se corresponde con la prueba de mayor potencia. Para algunos ejemplos de esto, véase este documento (distribución normal multivariante), o este (distribución exponencial), o la sección 4 de mi tesis .

Los bayesianos también pueden decir tanto que sí como que no

Hace algunos años, He publicado una pregunta aquí sobre si existe una equivalencia de intervalo de prueba también en la estadística bayesiana. La respuesta corta es que, utilizando las pruebas de hipótesis bayesianas estándar, la respuesta es "no". Sin embargo, reformulando un poco el problema de la prueba, la respuesta puede ser "sí". (Mis intentos de responder a mi propia pregunta acabaron convirtiéndose en un papel !)

2 votos

Buena respuesta (+1) y (lo haces parcialmente) puede ser bueno señalar el hecho de que a veces los intervalos de confianza y las pruebas de hipótesis tienen objetivos (potencialmente) contradictorios: uno trata de encontrar un intervalo de confianza "lo más pequeño posible" mientras que para las pruebas de hipótesis uno trata de encontrar una región crítica "lo más potente posible".

0 votos

@fcoppens: ¡Gracias por la sugerencia! He actualizado mi respuesta con algunas líneas sobre esto.

0 votos

Una buena tesis. ¿También trabajaste en el intervalo de Sterne?

4voto

Björn Puntos 457

Cuando se examina un único parámetro, es posible que una prueba sobre el valor del parámetro y el intervalo de confianza "no coincidan" dependiendo de cómo se construyan. En concreto, una prueba de hipótesis es un nivel $\alpha$ -prueba, si rechaza la hipótesis nula una proporción $\leq \alpha$ del tiempo cuando la hipótesis nula es verdadera. Por ello, se pueden utilizar, por ejemplo, estimaciones de los parámetros del modelo (por ejemplo, la varianza) que sólo son válidas bajo la hipótesis nula. Si luego se intenta construir un IC invirtiendo esta prueba, la cobertura puede no ser del todo correcta bajo la hipótesis alternativa. Por esta razón, se suele construir un intervalo de confianza de forma diferente para que la cobertura también sea correcta bajo la alternativa, lo que puede llevar a un desajuste (normalmente muy pequeño).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X