8 votos

Intervalo de confianza para la media - ¿Distribución normal o distribución t de Student?

He tomado $N$ mediciones $x_i$ del tiempo que tarda un programa de computadora en ejecutar un cálculo particular, y me gustaría calcular un intervalo de confianza del 95% para la media del tiempo de ejecución. Podemos calcular la media y la desviación estándar de la muestra de la manera habitual:

$$ \bar{x} = \frac{1}{N} \left( \sum_{i=1}^N {x_i} \right); s = \sqrt{\frac{\sum_{i=1}^N (x_i - \overline{x})^2}{N-1} } $$

Ahora, según entiendo, si $N \ge 30$, podemos recurrir al Teorema del Límite Central y decir que nuestra media de la muestra $\bar{x}$ proviene de una distribución normal con media $\mu$ y error estándar $\sigma / \sqrt{N}$, donde $\mu$ y $\sigma$ son la media y la desviación estándar de la población respectivamente. Por lo tanto, un intervalo de confianza del 95% para la media del tiempo de ejecución está limitado por, para algunos $k_1, k_2$:

$$ \bar{x} \pm k_1 \frac{\sigma}{\sqrt{N}}\ o\ \bar{x} \pm k_2 \frac{s}{\sqrt{N}} $$

Podemos tomar $k_1$ de la distribución normal: $k_1 = Z_{0.975} = 1.96$. Sin embargo, si necesitamos calcular un intervalo de confianza sin conocer $\sigma$, ¿qué valor deberíamos usar para $k_2$?

  1. Según el artículo Evaluación de rendimiento de Java estadísticamente rigurosa, también podemos tomar $k_2$ de la distribución normal: $k_2 = Z_{0.975} = 1.96$. Sin embargo, tengo entendido que en su lugar deberíamos usar la distribución t de Student con $N - 1$ grados de libertad: para $N = 30$ esto da $k_2 = t_{(0.975, 29)} = 2.045$. ¿Cuál de estos es correcto?

  2. El mismo artículo afirma que el método anterior (usar la distribución t) es válido incluso para $N < 30$. ¿Es esto cierto, dado que no podemos aplicar el Teorema del Límite Central en este caso? Si no, ¿hay algo que podamos decir sobre un intervalo de confianza para la media de la población en el caso de que $N < 30$?

1 votos

A menudo los tiempos de ejecución de la computadora para realizar una tarea específica están lejos de ser distribuidos de forma normal. Por lo tanto, mi respuesta proporciona información sobre los intervalos de confianza (IC) basados en datos no normales. // Siempre que la varianza de la población sea desconocida, un IC para datos normales es inherentemente un IC t (no un IC z) independientemente del tamaño de la muestra. Para grandes $n \ge 30$ (por lo tanto, grandes grados de libertad para t), y para un 95% de IC solamente, puedes usar 1.96 en lugar de un valor de corte de una distribución t como una aproximación.

0 votos

@BruceET - "A menudo los tiempos de ejecución de la computadora para realizar una tarea específica están lejos de ser normalmente distribuidos." Tengo la esperanza de que al tomar medidas, pueda aislar mi programa de eventos del sistema externo que pueden causar valores atípicos y/o un sesgo positivo significativo. Esperaba que esto, junto con el Teorema del Límite Central, significara que $N = 30$ mediciones son suficientes para que $\bar{x}$ sea aproximadamente normal y un IC de distribución t sea razonablemente preciso.

0 votos

Sin embargo, según tu respuesta, parece que $N = 30$ puede no ser "suficientemente grande" - ¿existe alguna metodología recomendada (quizás incluyendo una prueba de normalidad?) para determinar cuántas mediciones debería tomar antes de calcular un CI de distribución t?

13voto

manku Puntos 111

1. Datos normales, varianza conocida: Si tiene observaciones $X_1, X_2, \dots, X_n$ muestreadas al azar de una población normal con media desconocida $\mu$ y desviación estándar conocida $\sigma,$ entonces un intervalo de confianza (IC) del 95% para $\mu$ es $\bar X \pm 1.95 \sigma/\sqrt{n}.$ Esta es la única situación en la que el intervalo z es exactamente correcto.

2. Datos no normales, varianza conocida: Si la distribución de la población no es normal y la muestra es 'suficientemente grande', entonces $\bar X$ es aproximadamente normal y la misma fórmula proporciona un IC aproximado del 95%. La regla de que $n \ge 30$ es 'suficientemente grande' es poco confiable aquí. Si la distribución de la población tiene colas pesadas, entonces $\bar X$ puede no tener una distribución que se acerque a la normal (incluso si $n \ge 30).$ El 'Teorema del Límite Central', a menudo proporciona aproximaciones razonables para valores moderados de $n,$ pero es un teorema límite, con resultados garantizados solo cuando $n \rightarrow \infty.$

3. Datos normales, varianza desconocida. Si tiene observaciones $X_1, X_2, \dots, X_n$ muestreadas al azar de una población normal con media desconocida $\mu$ y desviación estándar desconocida $\sigma,$ con $\mu$ estimada por la media muestral $\bar X$ y $\sigma$ estimada por la desviación estándar muestral $S.$ Entonces un intervalo de confianza (IC) del 95% para $\mu$ es $\bar X \pm t^* S/\sqrt{n},$ donde $S$ es la desviación estándar muestral y donde donde $t^*$ corta la probabilidad $0.025$ del extremo superior de la distribución t de Student con $n - 1$ grados de libertad. Esta es la única situación en la que el intervalo t es exactamente correcto.

Ejemplos: Si $n=10$, entonces $t^* = 2.262$ y si $n = 30,$ entonces $t^* = 2.045.$ (Cálculos de R a continuación; también se podría usar una 'tabla t' impresa.)

qt(.975, 9);  qt(.975, 29)
[1] 2.262157  # para n = 10
[1] 2.04523   # para n = 30

Observe que 2.045 y 1.96 (de la Parte 1 anterior) ambos se redondean a 2.0. Si $n \ge 30$ entonces $t^*$ se redondea a 2.0. Esa es la base para la 'regla de 30', a menudo repetida sin pensar en otros contextos donde no es relevante.

No hay redondeo coincidente similar para IC con niveles de confianza diferentes al 95%. Por ejemplo, en la Parte 1 anterior un IC del 99% para $\mu$ se obtiene como $\bar X \pm 2.58 \sigma/\sqrt{n}.$ Sin embargo, $t^*=2.76$ para $n = 30$ y $t^* = 2.65$ para $n = 70.

qnorm(.995)
[1] 2.575829
qt(.995, 29)
[1] 2.756386
qt(.995, 69)
[1] 2.648977

4. Datos no normales, varianza desconocida: Los intervalos de confianza basados en la distribución t (como en la Parte 3 anterior) se sabe que son 'robustos' contra desviaciones moderadas de la normalidad. (Si $n$ es muy pequeño, no debería haber valores atípicos muy alejados o evidencia de asimetría severa.) Entonces, en un grado difícil de predecir, un IC t puede proporcionar un IC útil para $\mu.$ Por el contrario, si se conoce el tipo de distribución, puede ser posible encontrar una forma exacta de IC.

Por ejemplo, si $n = 30$ observaciones de una distribución (claramente no normal) exponencial con media desconocida $\mu$ tienen $\bar X = 17.24,\, S = 15.33,$ entonces el IC t del 95% (aproximado) es $(11.33, 23.15).$

t.test(x)

        Prueba t de una muestra

datos:  x
t = 5.9654, df = 29, valor-p = 1.752e-06
hipótesis alternativa: la media verdadera no es igual a 0
Intervalo de confianza del 95 por ciento:
 11.32947 23.15118
estimaciones de la muestra:
mean of x 
 17.24033 

Sin embargo, $$\frac{\bar X}{\mu} \sim \mathsf{Gamma}(\text{forma}=n,\text{tasa}=n),$$ por lo que $$P(L \le \bar X/\mu < U) = P(\bar X/U < \mu < \bar X/L)=0.95$$ y un IC exacto del 95% para $\mu$ es $(\bar X/U,\, \bar X/L) = (12.42, 25.16).$

qgamma(c(.025,.975), 30, 30)
[1] 0.6746958 1.3882946
mean(x)/qgamma(c(.975,.025), 30, 30)
[1] 12.41835 25.55274

Adición sobre IC de bootstrap: Si los datos parecen no ser normales, pero la distribución real de la población es desconocida, entonces un IC de bootstrap no paramétrico del 95% puede ser la mejor opción. Supongamos que tenemos $n=20$ observaciones de una distribución desconocida, con $\bar X = 13.54$ y los valores mostrados en el gráfico de tiras a continuación.

introducir descripción de la imagen aquí

Las observaciones parecen claramente sesgadas hacia la derecha y no pasan una prueba de normalidad de Shapiro-Wilk con un valor p de 0.001. Si asumimos que los datos son exponenciales y usamos el método en la Parte 4, el IC del 95% es $(9.13, 22.17),$ pero no tenemos forma de saber si los datos son exponenciales.

Por lo tanto, encontramos un bootstrap no paramétrico del 95% para aproximar $L^*$ y $U^*$ de manera que $P(L^* < D = \bar X/\mu < U^*) \approx 0.95.$ En el código R a continuación los sufijos .re indican cantidades 're-muestreadas' aleatoriamente basadas en $B$ muestras de tamaño $n$ seleccionadas aleatoriamente sin reemplazo entre las $n = 20$ observaciones. El IC resultante del 95% es $(9.17, 22.71).$ [Hay muchos estilos de IC de bootstrap. Este trata a $\mu$ como si fuera un parámetro de escala. Otras opciones son posibles.]

B = 10^5; a.obs = 13.54
d.re = replicate(B, mean(sample(x, 20, rep=T))/a.obs)
UL.re = quantile(d.re, c(.975,.025))
a.obs/UL.re
    97.5%      2.5%
 9.172171 22.714980

0 votos

Muchas gracias por esta información. En particular, parece que las respuestas a mis preguntas iniciales son:

0 votos

1. Dado que la varianza de la población es desconocida, el valor de la distribución t (por ejemplo, $2.045$ para $N = 30$) es el valor correcto a utilizar. Sin embargo, para $N \ge 30$, el valor de la distribución normal es una aproximación razonable.

0 votos

2. Si podemos asumir que los datos están distribuidos de forma normal, es válido calcular un IC utilizando la distribución t incluso si $N < 30$. Si no están distribuidos de forma normal, un IC de distribución t puede ser útil o no. Es interesante que el artículo "Evaluación de rendimiento de Java estadísticamente rigurosa" específicamente dice que, incluso para un $N pequeño, "calcular intervalos de confianza [de la distribución t] no requiere que los datos subyacentes sean [...] distribuidos normalmente".

0voto

Tommy Puntos 376

Primero, $\sigma \over \sqrt{n}$ no es la desviación estándar, es el error estándar. Segundo, k depende del nivel de confianza en el que estés interesado y, como dijiste, puede ser tomado ya sea de una distribución normal o t de Student. Tercero, la distribución t está destinada principalmente para tamaños de muestra pequeños ($n < 30$) y para tamaños de muestra grandes no importa si aplicas la distribución normal o la distribución t ya que ambas aproximadamente. Finalmente, si $\sigma$ no es conocido, es mejor usar la distribución t utilizando la desviación estándar de la muestra en lugar de $\sigma$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X