1. Datos normales, varianza conocida: Si tiene observaciones $X_1, X_2, \dots, X_n$ muestreadas al azar de una población normal con media desconocida $\mu$ y desviación estándar conocida $\sigma,$ entonces un intervalo de confianza (IC) del 95% para $\mu$ es $\bar X \pm 1.95 \sigma/\sqrt{n}.$ Esta es la única situación en la que el intervalo z es exactamente correcto.
2. Datos no normales, varianza conocida: Si la distribución de la población no es normal y la muestra es 'suficientemente grande', entonces $\bar X$ es aproximadamente normal y la misma fórmula proporciona un IC aproximado del 95%. La regla de que $n \ge 30$ es 'suficientemente grande' es poco confiable aquí. Si la distribución de la población tiene colas pesadas, entonces $\bar X$ puede no tener una distribución que se acerque a la normal (incluso si $n \ge 30).$ El 'Teorema del Límite Central', a menudo proporciona aproximaciones razonables para valores moderados de $n,$ pero es un teorema límite, con resultados garantizados solo cuando $n \rightarrow \infty.$
3. Datos normales, varianza desconocida. Si tiene observaciones $X_1, X_2, \dots, X_n$ muestreadas al azar de una población normal con media desconocida $\mu$ y desviación estándar desconocida $\sigma,$ con $\mu$ estimada por la media muestral $\bar X$ y $\sigma$ estimada por la desviación estándar muestral $S.$ Entonces un intervalo de confianza (IC) del 95% para $\mu$ es $\bar X \pm t^* S/\sqrt{n},$ donde $S$ es la desviación estándar muestral y donde donde $t^*$ corta la probabilidad $0.025$ del extremo superior de la distribución t de Student con $n - 1$ grados de libertad. Esta es la única situación en la que el intervalo t es exactamente correcto.
Ejemplos: Si $n=10$, entonces $t^* = 2.262$ y si $n = 30,$ entonces $t^* = 2.045.$ (Cálculos de R a continuación; también se podría usar una 'tabla t' impresa.)
qt(.975, 9); qt(.975, 29)
[1] 2.262157 # para n = 10
[1] 2.04523 # para n = 30
Observe que 2.045 y 1.96 (de la Parte 1 anterior) ambos se redondean a 2.0. Si $n \ge 30$ entonces $t^*$ se redondea a 2.0. Esa es la base para la 'regla de 30', a menudo repetida sin pensar en otros contextos donde no es relevante.
No hay redondeo coincidente similar para IC con niveles de confianza diferentes al 95%. Por ejemplo, en la Parte 1 anterior un IC del 99% para $\mu$ se obtiene como $\bar X \pm 2.58 \sigma/\sqrt{n}.$ Sin embargo, $t^*=2.76$ para $n = 30$ y $t^* = 2.65$ para $n = 70.
qnorm(.995)
[1] 2.575829
qt(.995, 29)
[1] 2.756386
qt(.995, 69)
[1] 2.648977
4. Datos no normales, varianza desconocida: Los intervalos de confianza basados en la distribución t (como en la Parte 3 anterior) se sabe que son 'robustos' contra desviaciones moderadas de la normalidad. (Si $n$ es muy pequeño, no debería haber valores atípicos muy alejados o evidencia de asimetría severa.) Entonces, en un grado difícil de predecir, un IC t puede proporcionar un IC útil para $\mu.$ Por el contrario, si se conoce el tipo de distribución, puede ser posible encontrar una forma exacta de IC.
Por ejemplo, si $n = 30$ observaciones de una distribución (claramente no normal) exponencial con media desconocida $\mu$ tienen $\bar X = 17.24,\, S = 15.33,$ entonces el IC t del 95% (aproximado) es $(11.33, 23.15).$
t.test(x)
Prueba t de una muestra
datos: x
t = 5.9654, df = 29, valor-p = 1.752e-06
hipótesis alternativa: la media verdadera no es igual a 0
Intervalo de confianza del 95 por ciento:
11.32947 23.15118
estimaciones de la muestra:
mean of x
17.24033
Sin embargo, $$\frac{\bar X}{\mu} \sim \mathsf{Gamma}(\text{forma}=n,\text{tasa}=n),$$ por lo que $$P(L \le \bar X/\mu < U) = P(\bar X/U < \mu < \bar X/L)=0.95$$ y un IC exacto del 95% para $\mu$ es $(\bar X/U,\, \bar X/L) = (12.42, 25.16).$
qgamma(c(.025,.975), 30, 30)
[1] 0.6746958 1.3882946
mean(x)/qgamma(c(.975,.025), 30, 30)
[1] 12.41835 25.55274
Adición sobre IC de bootstrap: Si los datos parecen no ser normales, pero la distribución real de la población es desconocida, entonces un IC de bootstrap no paramétrico del 95% puede ser la mejor opción. Supongamos que tenemos $n=20$ observaciones de una distribución desconocida, con $\bar X = 13.54$ y los valores mostrados en el gráfico de tiras a continuación.
Las observaciones parecen claramente sesgadas hacia la derecha y no pasan una prueba de normalidad de Shapiro-Wilk con un valor p de 0.001. Si asumimos que los datos son exponenciales y usamos el método en la Parte 4, el IC del 95% es $(9.13, 22.17),$ pero no tenemos forma de saber si los datos son exponenciales.
Por lo tanto, encontramos un bootstrap no paramétrico del 95% para aproximar $L^*$ y $U^*$ de manera que $P(L^* < D = \bar X/\mu < U^*) \approx 0.95.$ En el código R a continuación los sufijos .re
indican cantidades 're-muestreadas' aleatoriamente basadas en $B$ muestras de tamaño $n$ seleccionadas aleatoriamente sin reemplazo entre las $n = 20$ observaciones. El IC resultante del 95% es $(9.17, 22.71).$ [Hay muchos estilos de IC de bootstrap. Este trata a $\mu$ como si fuera un parámetro de escala. Otras opciones son posibles.]
B = 10^5; a.obs = 13.54
d.re = replicate(B, mean(sample(x, 20, rep=T))/a.obs)
UL.re = quantile(d.re, c(.975,.025))
a.obs/UL.re
97.5% 2.5%
9.172171 22.714980
1 votos
A menudo los tiempos de ejecución de la computadora para realizar una tarea específica están lejos de ser distribuidos de forma normal. Por lo tanto, mi respuesta proporciona información sobre los intervalos de confianza (IC) basados en datos no normales. // Siempre que la varianza de la población sea desconocida, un IC para datos normales es inherentemente un IC t (no un IC z) independientemente del tamaño de la muestra. Para grandes $n \ge 30$ (por lo tanto, grandes grados de libertad para t), y para un 95% de IC solamente, puedes usar 1.96 en lugar de un valor de corte de una distribución t como una aproximación.
0 votos
@BruceET - "A menudo los tiempos de ejecución de la computadora para realizar una tarea específica están lejos de ser normalmente distribuidos." Tengo la esperanza de que al tomar medidas, pueda aislar mi programa de eventos del sistema externo que pueden causar valores atípicos y/o un sesgo positivo significativo. Esperaba que esto, junto con el Teorema del Límite Central, significara que $N = 30$ mediciones son suficientes para que $\bar{x}$ sea aproximadamente normal y un IC de distribución t sea razonablemente preciso.
0 votos
Sin embargo, según tu respuesta, parece que $N = 30$ puede no ser "suficientemente grande" - ¿existe alguna metodología recomendada (quizás incluyendo una prueba de normalidad?) para determinar cuántas mediciones debería tomar antes de calcular un CI de distribución t?