8 votos

Intervalo de confianza para la media - ¿Distribución normal o t de Student?

He tomado $N$ mediciones $x_i$ del tiempo que tarda un programa de computadora en ejecutar un cálculo en particular, y me gustaría calcular un intervalo de confianza del 95% para la media de tiempo de ejecución. Podemos calcular la media muestral y la desviación estándar de la manera habitual:

$$ \bar{x} = \frac{1}{N} \left( \sum_{i=1}^N {x_i} \right); s = \sqrt{\frac{\sum_{i=1}^N (x_i - \overline{x})^2}{N-1} } $$

Ahora, según mi entendimiento, si $N \ge 30$, podemos recurrir al Teorema del Límite Central y decir que nuestra media muestral $\bar{x}$ proviene de una distribución normal con media $\mu$ y error estándar $\sigma / \sqrt{N}$, donde $\mu$ y $\sigma$ son respectivamente la media y la desviación estándar de la población. Por lo tanto, un intervalo de confianza del 95% para la media del tiempo de ejecución está limitado por, para algunos $k_1, k_2$:

$$ \bar{x} \pm k_1 \frac{\sigma}{\sqrt{N}}\ o\ \bar{x} \pm k_2 \frac{s}{\sqrt{N}} $$

Podemos obtener $k_1$ de la distribución normal: $k_1 = Z_{0.975} = 1.96$. Sin embargo, si necesitamos calcular un intervalo de confianza sin conocer $\sigma$, ¿qué valor deberíamos usar para $k_2$?

  1. Según el paper Evaluación de rendimiento de Java estadísticamente rigurosa, también podemos obtener $k_2$ de la distribución normal: $k_2 = Z_{0.975} = 1.96$. Sin embargo, mi entendimiento es que deberíamos usar la distribución t de Student con $N - 1$ grados de libertad: para $N = 30$ esto da $k_2 = t_{(0.975, 29)} = 2.045$. ¿Cuál de estos es el correcto?

  2. El mismo paper afirma que el método anterior (usando la distribución t) es válido incluso para $N < 30$. ¿Es esto cierto, dado que no podemos aplicar el Teorema del Límite Central en este caso? Si no es así, ¿hay algo que podamos decir sobre un intervalo de confianza para la media de la población en el caso $N < 30$?

1 votos

A menudo, los tiempos de ejecución de las computadoras para realizar una tarea específica están lejos de estar distribuidos normalmente. Por lo tanto, mi respuesta proporciona información sobre intervalos de confianza (CIs) basados en datos no normales. Siempre la varianza de la población es desconocida, un IC para datos normales es inherentemente un CI t (no un CI z) independientemente del tamaño de la muestra. Para un tamaño de muestra grande $ n \ge 30 $ (por lo tanto, grandes grados de libertad para t), y para un IC del 95% solamente, puede usar 1.96 en lugar de un valor de corte de una distribución t como una aproximación.

0 votos

@BruceET - "A menudo los tiempos de funcionamiento de las computadoras para realizar una tarea específica están lejos de estar distribuidos normalmente." Tengo la esperanza de que al tomar mediciones, pueda aislar mi programa de eventos del sistema externo que pueden causar valores atípicos y/o un sesgo positivo significativo. Esperaba que esto, junto con el Teorema del Límite Central, significara que $N = 30$ mediciones son suficientes para que $\bar{x}$ sea aproximadamente normal y un IC de distribución t sea razonablemente preciso.

0 votos

Sin embargo, a partir de su respuesta, parece que $N = 30$ puede no ser "suficientemente grande" - ¿hay una metodología recomendada (quizás incluyendo una prueba de normalidad) para determinar cuántas mediciones debo tomar antes de calcular un IC de distribución t?

13voto

manku Puntos 111

1. Datos normales, varianza conocida: Si tiene observaciones $X_1, X_2, \dots, X_n$ muestreadas al azar de una población normal con media desconocida $\mu$ y desviación estándar conocida $\sigma,$ entonces un intervalo de confianza (IC) del 95% para $\mu$ es $\bar X \pm 1.95 \sigma/\sqrt{n}.$ Esta es la única situación en la que el intervalo z es exactamente correcto.

2. Datos no normales, varianza conocida: Si la distribución de la población no es normal y la muestra es 'suficientemente grande', entonces $\bar X$ es aproximadamente normal y la misma fórmula proporciona un IC aproximado del 95%. La regla de que $n \ge 30$ es 'suficientemente grande' no es confiable aquí. Si la distribución de la población tiene colas pesadas, entonces $\bar X$ puede no tener una distribución cercana a la normal (incluso si $n \ge 30).$ El 'Teorema del Límite Central' a menudo proporciona aproximaciones razonables para valores moderados de $n,$ pero es un teorema de límites, con resultados garantizados solo cuando $n \rightarrow \infty.$

3. Datos normales, varianza desconocida. Si tiene observaciones $X_1, X_2, \dots, X_n$ muestreadas al azar de una población normal con media desconocida $\mu$ y desviación estándar $\sigma$ desconocida, con $\mu$ estimada por la media de la muestra $\bar X$ y $\sigma$ estimada por la desviación estándar de la muestra $S.$ Entonces un intervalo de confianza (IC) del 95% para $\mu$ es $\bar X \pm t^* S/\sqrt{n},$ donde $S$ es la desviación estándar de la muestra y donde $t^*$ corta la probabilidad $0.025$ de la cola superior de la distribución t de Student con $n - 1$ grados de libertad. Esta es la única situación en la que el intervalo t es exactamente correcto.

Ejemplos: Si $n=10$, entonces $t^* = 2.262$ y si $n = 30,$ entonces $t^* = 2.045.$ (Cálculos desde R abajo; también se podría usar una 'tabla t' impresa.)

qt(.975, 9);  qt(.975, 29)
[1] 2.262157  # para n = 10
[1] 2.04523   # para n = 30

Observe que 2.045 y 1.96 (de la Parte 1 arriba) ambos se redondean a 2.0. Si $n \ge 30$ entonces $t^*$ se redondea a 2.0. Esa es la base para la 'regla de 30', a menudo repetida sin pensar en otros contextos donde no es relevante.

No hay un redondeo coincidental similar para IC con niveles de confianza distintos al 95%. Por ejemplo, en la Parte 1 anterior un IC del 99% para $\mu$ se obtiene como $\bar X \pm 2.58 \sigma/\sqrt{n}.$ Sin embargo, $t^*=2.76$ para $n = 30$ y $t^* = 2.65$ para $n = 70.

qnorm(.995)
[1] 2.575829
qt(.995, 29)
[1] 2.756386
qt(.995, 69)
[1] 2.648977

4. Datos no normales, varianza desconocida: Los intervalos de confianza basados en la distribución t (como en la Parte 3 anterior) son conocidos por ser 'robustos' contra desviaciones moderadas de la normalidad. (Si $n$ es muy pequeño, no debería haber valores atípicos lejanos o evidencia de asimetría severa.) Entonces, hasta cierto grado es difícil predecir, un IC t puede proporcionar un CI útil para $\mu.$ Por el contrario, si se conoce el tipo de distribución, puede ser posible encontrar una forma exacta de IC.

Por ejemplo, si $n = 30$ observaciones de una distribución exponencial (claramente no normal) con media desconocida $\mu$ tienen $\bar X = 17.24,\, S = 15.33,$ entonces el IC t (aproximado) del 95% es $(11.33, 23.15).$

t.test(x)

        Prueba de una muestra t

datos:  x
t = 5.9654, df = 29, valor-p = 1.752e-06
hipótesis alternativa: la verdadera media no es igual a 0
intervalo de confianza del 95%:
 11.32947 23.15118
estimaciones de muestra:
media de x 
 17.24033 

Sin embargo, $$\frac{\bar X}{\mu} \sim \mathsf{Gamma}(\text{forma}=n,\text{tasa}=n),$$ de modo que $$P(L \le \bar X/\mu < U) = P(\bar X/U < \mu < \bar X/L)=0.95$$ y un CI exacto del 95% para $\mu$ es $(\bar X/U,\, \bar X/L) = (12.42, 25.16).$

qgamma(c(.025,.975), 30, 30)
[1] 0.6746958 1.3882946
mean(x)/qgamma(c(.975,.025), 30, 30)
[1] 12.41835 25.55274

Addendum sobre CI bootstrap: Si los datos parecen no ser normales, pero la distribución real de la población es desconocida, entonces un 95% CI bootstrap no paramétrico puede ser la mejor elección. Supongamos que tenemos $n=20$ observaciones de una distribución desconocida, con $\bar X$ = 13.54$ y valores mostrados en el gráfico de franjas a continuación.

ingresa la descripción de la imagen aquí

Las observaciones parecen tener una clara asimetría hacia la derecha y fallan una prueba de normalidad de Shapio-Wilk con un valor-p de 0.001. Si asumimos que los datos son exponenciales y usamos el método en la Parte 4, el IC del 95% es $(9.13, 22.17),$ pero no tenemos forma de saber si los datos son exponenciales.

Por lo tanto, encontramos un bootstrap no paramétrico del 95% para aproximar $L^*$ y $U^*$ de manera que $P(L^* < D = \bar X/\mu < U^*) \approx 0.95.$ En el código R a continuación los sufijos .re indican cantidades 're-muestreadas' aleatorias basadas en $B$ muestras de tamaño $n$ elegidas aleatoriamente sin reemplazo entre las $n = 20$ observaciones. El CI resultante del 95% es $(9.17, 22.71).$ [Hay muchos estilos de bootstrap CIs. Este trata a $\mu$ como si fuera un parámetro de escala. Otras opciones son posibles.]

B = 10^5; a.obs = 13.54
d.re = replicate(B, mean(sample(x, 20, rep=T))/a.obs)
UL.re = quantile(d.re, c(.975,.025))
a.obs/UL.re
    97.5%      2.5%
 9.172171 22.714980

0 votos

Gracias por esta información. En particular, parece que las respuestas a mis preguntas iniciales son:

0 votos

1. Dado que la varianza poblacional es desconocida, el valor de la distribución t (por ejemplo, $2.045$ para $N = 30$) es el valor correcto a utilizar. Sin embargo, para $N \ge 30$, el valor de la distribución normal es una aproximación razonable.

0 votos

2. Si podemos asumir que los datos siguen una distribución normal, es válido calcular un IC utilizando la distribución t incluso si $N < 30$. Si no siguen una distribución normal, un IC de distribución t puede o no ser útil. Es interesante que el artículo "Evaluación de rendimiento de Java estadísticamente rigurosa" específicamente menciona que, incluso para $N$ pequeños, "el cálculo de intervalos de confianza [de distribución t] no requiere que los datos subyacentes sean [...] distribuidos normalmente".

0voto

Tommy Puntos 376

Primero, $\sigma \over \sqrt{n}$ no es desviación estándar, es error estándar. Segundo, k depende del nivel de confianza en el que estás interesado y, como dijiste, puede ser tomado ya sea de una distribución normal o t de Student. Tercero, la distribución t está destinada principalmente para tamaños de muestra pequeños ($n < 30$) y para tamaños de muestra grandes no importa si aplicas la distribución normal o la distribución t ya que ambas aproximaciones. Finalmente, si $\sigma$ no es conocido, es mejor usar la distribución t utilizando la desviación estándar de la muestra en lugar de $\sigma$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X