1. Datos normales, varianza conocida: Si tiene observaciones $X_1, X_2, \dots, X_n$ muestreadas al azar de una población normal con media desconocida $\mu$ y desviación estándar conocida $\sigma,$ entonces un intervalo de confianza (IC) del 95% para $\mu$ es $\bar X \pm 1.95 \sigma/\sqrt{n}.$ Esta es la única situación en la que el intervalo z es exactamente correcto.
2. Datos no normales, varianza conocida: Si la distribución de la población no es normal y la muestra es 'suficientemente grande', entonces $\bar X$ es aproximadamente normal y la misma fórmula proporciona un IC aproximado del 95%. La regla de que $n \ge 30$ es 'suficientemente grande' no es confiable aquí. Si la distribución de la población tiene colas pesadas, entonces $\bar X$ puede no tener una distribución cercana a la normal (incluso si $n \ge 30).$ El 'Teorema del Límite Central' a menudo proporciona aproximaciones razonables para valores moderados de $n,$ pero es un teorema de límites, con resultados garantizados solo cuando $n \rightarrow \infty.$
3. Datos normales, varianza desconocida. Si tiene observaciones $X_1, X_2, \dots, X_n$ muestreadas al azar de una población normal con media desconocida $\mu$ y desviación estándar $\sigma$ desconocida, con $\mu$ estimada por la media de la muestra $\bar X$ y $\sigma$ estimada por la desviación estándar de la muestra $S.$ Entonces un intervalo de confianza (IC) del 95% para $\mu$ es $\bar X \pm t^* S/\sqrt{n},$ donde $S$ es la desviación estándar de la muestra y donde $t^*$ corta la probabilidad $0.025$ de la cola superior de la distribución t de Student con $n - 1$ grados de libertad. Esta es la única situación en la que el intervalo t es exactamente correcto.
Ejemplos: Si $n=10$, entonces $t^* = 2.262$ y si $n = 30,$ entonces $t^* = 2.045.$ (Cálculos desde R abajo; también se podría usar una 'tabla t' impresa.)
qt(.975, 9); qt(.975, 29)
[1] 2.262157 # para n = 10
[1] 2.04523 # para n = 30
Observe que 2.045 y 1.96 (de la Parte 1 arriba) ambos se redondean a 2.0. Si $n \ge 30$ entonces $t^*$ se redondea a 2.0. Esa es la base para la 'regla de 30', a menudo repetida sin pensar en otros contextos donde no es relevante.
No hay un redondeo coincidental similar para IC con niveles de confianza distintos al 95%. Por ejemplo, en la Parte 1 anterior un IC del 99% para $\mu$ se obtiene como $\bar X \pm 2.58 \sigma/\sqrt{n}.$ Sin embargo, $t^*=2.76$ para $n = 30$ y $t^* = 2.65$ para $n = 70.
qnorm(.995)
[1] 2.575829
qt(.995, 29)
[1] 2.756386
qt(.995, 69)
[1] 2.648977
4. Datos no normales, varianza desconocida: Los intervalos de confianza basados en la distribución t (como en la Parte 3 anterior) son conocidos por ser 'robustos' contra desviaciones moderadas de la normalidad. (Si $n$ es muy pequeño, no debería haber valores atípicos lejanos o evidencia de asimetría severa.) Entonces, hasta cierto grado es difícil predecir, un IC t puede proporcionar un CI útil para $\mu.$ Por el contrario, si se conoce el tipo de distribución, puede ser posible encontrar una forma exacta de IC.
Por ejemplo, si $n = 30$ observaciones de una distribución exponencial (claramente no normal) con media desconocida $\mu$ tienen $\bar X = 17.24,\, S = 15.33,$ entonces el IC t (aproximado) del 95% es $(11.33, 23.15).$
t.test(x)
Prueba de una muestra t
datos: x
t = 5.9654, df = 29, valor-p = 1.752e-06
hipótesis alternativa: la verdadera media no es igual a 0
intervalo de confianza del 95%:
11.32947 23.15118
estimaciones de muestra:
media de x
17.24033
Sin embargo, $$\frac{\bar X}{\mu} \sim \mathsf{Gamma}(\text{forma}=n,\text{tasa}=n),$$ de modo que $$P(L \le \bar X/\mu < U) = P(\bar X/U < \mu < \bar X/L)=0.95$$ y un CI exacto del 95% para $\mu$ es $(\bar X/U,\, \bar X/L) = (12.42, 25.16).$
qgamma(c(.025,.975), 30, 30)
[1] 0.6746958 1.3882946
mean(x)/qgamma(c(.975,.025), 30, 30)
[1] 12.41835 25.55274
Addendum sobre CI bootstrap: Si los datos parecen no ser normales, pero la distribución real de la población es desconocida, entonces un 95% CI bootstrap no paramétrico puede ser la mejor elección. Supongamos que tenemos $n=20$ observaciones de una distribución desconocida, con $\bar X$ = 13.54$ y valores mostrados en el gráfico de franjas a continuación.
Las observaciones parecen tener una clara asimetría hacia la derecha y fallan una prueba de normalidad de Shapio-Wilk con un valor-p de 0.001. Si asumimos que los datos son exponenciales y usamos el método en la Parte 4, el IC del 95% es $(9.13, 22.17),$ pero no tenemos forma de saber si los datos son exponenciales.
Por lo tanto, encontramos un bootstrap no paramétrico del 95% para aproximar $L^*$ y $U^*$ de manera que $P(L^* < D = \bar X/\mu < U^*) \approx 0.95.$ En el código R a continuación los sufijos .re
indican cantidades 're-muestreadas' aleatorias basadas en $B$ muestras de tamaño $n$ elegidas aleatoriamente sin reemplazo entre las $n = 20$ observaciones. El CI resultante del 95% es $(9.17, 22.71).$ [Hay muchos estilos de bootstrap CIs. Este trata a $\mu$ como si fuera un parámetro de escala. Otras opciones son posibles.]
B = 10^5; a.obs = 13.54
d.re = replicate(B, mean(sample(x, 20, rep=T))/a.obs)
UL.re = quantile(d.re, c(.975,.025))
a.obs/UL.re
97.5% 2.5%
9.172171 22.714980
1 votos
A menudo, los tiempos de ejecución de las computadoras para realizar una tarea específica están lejos de estar distribuidos normalmente. Por lo tanto, mi respuesta proporciona información sobre intervalos de confianza (CIs) basados en datos no normales. Siempre la varianza de la población es desconocida, un IC para datos normales es inherentemente un CI t (no un CI z) independientemente del tamaño de la muestra. Para un tamaño de muestra grande $ n \ge 30 $ (por lo tanto, grandes grados de libertad para t), y para un IC del 95% solamente, puede usar 1.96 en lugar de un valor de corte de una distribución t como una aproximación.
0 votos
@BruceET - "A menudo los tiempos de funcionamiento de las computadoras para realizar una tarea específica están lejos de estar distribuidos normalmente." Tengo la esperanza de que al tomar mediciones, pueda aislar mi programa de eventos del sistema externo que pueden causar valores atípicos y/o un sesgo positivo significativo. Esperaba que esto, junto con el Teorema del Límite Central, significara que $N = 30$ mediciones son suficientes para que $\bar{x}$ sea aproximadamente normal y un IC de distribución t sea razonablemente preciso.
0 votos
Sin embargo, a partir de su respuesta, parece que $N = 30$ puede no ser "suficientemente grande" - ¿hay una metodología recomendada (quizás incluyendo una prueba de normalidad) para determinar cuántas mediciones debo tomar antes de calcular un IC de distribución t?