43 votos

Relación entre el intervalo de confianza y prueba de hipótesis estadística para la prueba de t de

Es bien sabido que los intervalos de confianza y pruebas de hipótesis estadísticas están fuertemente relacionados. Mi pregunta se centra en la comparación de medias de dos grupos con base en una variable numérica. Vamos a suponer que dicha hipótesis se ha probado el uso de t-test. Por otro lado, uno puede calcular intervalos de confianza para medias de ambos grupos. ¿Hay alguna relación entre la superposición de los intervalos de confianza y el rechazo de la hipótesis nula de que los medios son iguales (en favor de la alternativa que significa diferir - prueba de dos caras)? Por ejemplo, un test podría rechazar la hipótesis nula si el intervalo de confianza no se traslapan.

51voto

jldugger Puntos 7490

Sí, hay algunas relaciones simples entre el intervalo de confianza de comparaciones y pruebas de hipótesis en una amplia gama de prácticas de configuración. Sin embargo, además de la comprobación de la CI procedimientos y t-test son apropiados para nuestros datos, debemos comprobar que el tamaño de la muestra no son demasiado diferentes y que los dos conjuntos tienen similares desviaciones estándar. También no deberíamos intentar derivar de gran precisión los valores de p de la comparación de dos intervalos de confianza, pero debería estar contento de desarrollar una aproximaciones.

En el intento de conciliar las dos respuestas ya dadas (por @Juan y @Brett), ayuda a ser matemáticamente explícito. Una fórmula para un simétrica de dos caras intervalo de confianza adecuado para el establecimiento de esta pregunta es

$$\text{CI} = m \pm \frac{t_\alpha(n) s}{\sqrt{n}}$$

donde $m$ es la media de la muestra de $n$ observaciones independientes, $s$ es la desviación estándar de la muestra, $2\alpha$ es el deseado tamaño de la prueba (máxima tasa de falsos positivos), y $t_\alpha(n)$ es el superior de $1-\alpha$ percentil de la distribución t de Student.

El uso de subíndices $1$ $2$ a distinguir dos conjuntos independientes de datos para la comparación, con $1$ correspondiente al mayor de los dos medios, un no-superposición de los intervalos de confianza se expresa por la desigualdad (límite de confianza inferior 1) $\gt$ (límite de confianza superior 2); viz.,

$$m_1 - \frac{t_\alpha(n_1) s_1}{\sqrt{n_1}} \gt m_2 + \frac{t_\alpha(n_2) s_2}{\sqrt{n_2}}.$$

Esto puede ser hecho para parecer como el t-estadístico de la correspondiente prueba de hipótesis (para comparar los dos medios) con simples manipulaciones algebraicas, produciendo

$$\frac{m_1-m_2}{\sqrt{s_1^2/n_1 + s_2^2/n_2}} \gt \frac{s_1\sqrt{n_2}t_\alpha(n_1) + s_2\sqrt{n_1}t_\alpha(n_2)}{\sqrt{n_1 s_2^2 + n_2 s_1^2}}.$$

El lado izquierdo es la estadística que se utiliza en la prueba de hipótesis, es por lo general en comparación con un percentil de una distribución t de Student con $n_1+n_2$ grados de libertad: que es, a $t_\alpha(n_1+n_2)$. El lado derecho es una visión sesgada promedio ponderado de la original t de la distribución de los percentiles.

El análisis hasta ahora justifica la respuesta por @Brett: no parece haber ninguna relación sencilla disponible. Sin embargo, vamos a investigar más. Me siento inspirada para hacerlo porque, intuitivamente, una superposición de los intervalos de confianza debería decir algo!

En primer lugar, observe que este formulario de la prueba de hipótesis es válida sólo cuando se espera $s_1$ $s_2$ a de ser de al menos aproximadamente igual. (De lo contrario nos enfrentamos a la notoria de Behrens-Fisher problema y sus complejidades.) Tras la comprobación de la igualdad aproximada de la $s_i$, entonces podríamos crear un aproximado de simplificación en la forma

$$\frac{m_1-m_2}{s\sqrt{1/n_1 + 1/n_2}} \gt \frac{\sqrt{n_2}t_\alpha(n_1) + \sqrt{n_1}t_\alpha(n_2)}{\sqrt{n_1 + n_2}}.$$

Aquí, $s \approx s_1 \approx s_2$. De manera realista, no debemos esperar que esto informal comparación de los límites de confianza de tener el mismo tamaño como $\alpha$. Nuestra pregunta es si existe una $\alpha'$ de manera tal que el lado derecho es (al menos aproximadamente) igual a la correcta t estadística. Es decir, por lo $\alpha'$ es el caso que

$$t_{\alpha'}(n_1+n_2) = \frac{\sqrt{n_2}t_\alpha(n_1) + \sqrt{n_1}t_\alpha(n_2)}{\sqrt{n_1 + n_2}}\text{?}$$

Resulta que para la igualdad de tamaños de muestra, $\alpha$ $\alpha'$ están conectados (a muy alta precisión) por una ley de potencia. Por ejemplo, aquí es un log-log de la trama de los dos para los casos de $n_1=n_2=2$ (el más bajo de la línea azul), $n_1=n_2=5$ (en el medio de la línea roja), $n_1=n_2=\infty$ (la más alta línea de oro). La media línea verde discontinua es una aproximación se describe a continuación. La rectitud de estas curvas se contradice una ley de potencia. Varía con $n=n_1=n_2$, pero no mucho.

Plot 1

La respuesta depende de que el conjunto de $\{n_1, n_2\}$, pero es natural preguntarse cuánto realmente varía con los cambios en el tamaño de la muestra. En particular, se podría esperar que para los moderados para grandes tamaños de muestra (quizá $n_1 \ge 10, n_2 \ge 10$ o menos) el tamaño de la muestra hace poca diferencia. En este caso, podríamos desarrollar un cuantitativa de la forma de relacionarse $\alpha'$$\alpha$.

Este enfoque resulta de trabajo a condición de que el tamaño de la muestra no son muy diferentes el uno del otro. En el espíritu de sencillez, voy a informar de un ómnibus de la fórmula para calcular el tamaño de la prueba $\alpha'$ correspondiente al intervalo de confianza tamaño de la $\alpha$. Es

$$\alpha' \approx e \alpha^{1.91};$$

es decir,

$$\alpha' \approx \exp(1 + 1.91\log(\alpha)).$$

Esta fórmula funciona razonablemente bien en estas situaciones comunes:

  • Ambos tamaños de muestra son cerca uno del otro, $n_1 \approx n_2$, e $\alpha$ no es demasiado extrema ($\alpha \gt .001$ o así).

  • Un tamaño de la muestra está dentro de aproximadamente tres veces la del otro y el más pequeño no es demasiado pequeño (aproximadamente, mayor que $10$) y, de nuevo, $\alpha$ no es demasiado extrema.

  • Un tamaño de la muestra es dentro de tres veces la del otro y $\alpha \gt .02$ o así.

El error relativo (valor correcto dividido por la aproximación) en la primera situación se representa aquí, con la parte inferior (azul) de la línea que muestra el caso de $n_1=n_2=2$, la media (rojo) de la línea en el caso de $n_1=n_2=5$, y el superior (de oro) de la línea en el caso de $n_1=n_2=\infty$. Interpolando entre los dos últimos, vemos que la aproximación es excelente para una amplia gama de práctica los valores de $\alpha$ cuando los tamaños de muestra son moderadas (alrededor de 5 a 50) y otra cosa es razonablemente buena.

Plot 2

Esto es más que suficiente para que echando un vistazo a un montón de intervalos de confianza.

Para resumir, el fracaso de dos $2\alpha$-tamaño de los intervalos de confianza de los medios a la superposición es importante evidencia de una diferencia en los medios a un nivel igual a $2e \alpha^{1.91}$, siempre y cuando las dos muestras tienen aproximadamente igual desviaciones estándar y son aproximadamente del mismo tamaño.

Voy a terminar con una tabulación de la aproximación de los valores comunes de $2\alpha$.

$2\alpha$ $2\alpha'$
0.1 0.02

0.05 0.005

0.01 0.0002

0.005 0.00006

Por ejemplo, cuando un par de dos caras 95% CIs ($2\alpha=.05$) para las muestras de tamaños aproximadamente iguales no se superponen, se deben tomar los medios para ser significativamente diferentes, $p \lt .005$. La correcta p-valor (para la igualdad de tamaños de muestra $n$) en realidad se encuentra entre $.0037$ ($n=2$) y $.0056$ ($n=\infty$).

Este resultado justifica (y espero que mejora a) la respuesta de @Juan. Así pues, aunque las respuestas anteriores parecen estar en conflicto, ambos son (a su manera) correcto.

11voto

Bajo típico de la hipótesis de igualdad de varianza, sí, hay una relación. Si las barras se superponen por menos de la longitud de una barra de * sqrt(2), a continuación, un t-test encontraría a ser significativamente diferentes en alfa = 0,05. Si los extremos de las barras apenas toque entonces la diferencia se encontraría en 0,01. Si los intervalos de confianza para los grupos no son iguales uno normalmente se toma el promedio y se aplica la misma regla.

Alternativamente, si el ancho de un intervalo de confianza alrededor de uno de los medios es w, a continuación, el menos significativo de la diferencia entre los dos valores es w * sqrt(2). Esto es simple cuando usted piensa en el denominador en los grupos independientes prueba t, sqrt(2*MSE/n), y el factor de la CI que, sqrt(MSE/n).

(95% ic se supone)

Hay un simple papel en hacer inferencias a partir de los intervalos de confianza en torno a los medios independientes aquí. Va a responder a esta pregunta y muchas otras relacionadas con la que usted tiene.

9voto

Rob Wells Puntos 361

No, no es tan sencillo, al menos.

Hay, sin embargo, una correspondencia exacta entre la prueba de t de diferencia entre los dos medios y el intervalo de confianza para la diferencia entre los dos medios.

Si el intervalo de confianza para la diferencia entre dos medios contiene cero, un t-test para que la diferencia no serían capaces de rechazar nulo en el mismo nivel de confianza. Del mismo modo, si el intervalo de confianza no contiene 0, la prueba de t podría rechazar la nula.

Esto no es igual a superposición entre los intervalos de confianza para cada uno de los dos medios.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X