Cuando hablamos de un intervalo de confianza del 95% para esa media muestral lo entiendo como que "dado que asumimos una distribución normal para la distribución muestral de las medias muestrales de muestras de tamaño n=100, hay un 95% de posibilidades de que la media de nuestra muestra caiga en un punto bajo nuestra curva de distribución muestral (normal) tal que la verdadera media de la población estará dentro de las 2 desviaciones desviaciones estándar de la media de nuestra muestra". (¿es esto correcto?)
Esto no es del todo correcto, y es uno de los errores más comunes en estadística. Puede encontrar más discusión aquí . El intervalo de confianza del 95% significa que tenemos un 95% de confianza en que el parámetro se encuentra en nuestro intervalo. Otra forma de pensar en esto es que, si repitiéramos el muestreo muchas más veces y creáramos intervalos de confianza cada vez, aproximadamente el 95% de esos intervalos de confianza contendrían el parámetro verdadero.
Por lo demás, tienes razón en que cuando apelamos a la CLT de esta manera (al suponer la normalidad de la media muestral), hay un error añadido, ya que la distribución nunca va a ser exacta. Sin embargo, nuestra confianza en la estimación puede aumentar o disminuir.
Esta es una cita de Tsou y Royall(1995)
Un popular $95\%$ intervalo de confianza para $E(X)$ basado en $n$ observaciones es el $t$ intervalo, $\bar{x} \pm t_{n-1} sn^{-1/2}$ , donde $s^2 = \sum (x - \bar{x}^2)/(n-1)$ . Esto es en realidad un $95\%$ intervalo de confianza si el $X$ son iid $N(\theta, \sigma^2)$ . Pero si este modelo es incorrecto, entonces ya no es cierto que la probabilidad de cobertura es igual al coeficiente de confianza nominal, 0,95.
Voy a simular este comportamiento en el siguiente código R. Dibujo muestras de tamaño $N = 50$ a partir de una población Normal(5, 1) y de una población $t_{1}$ con media $\mu = 5$ . En el primer caso, como la población es realmente normal, la distribución de la media muestral es exactamente normal. En el segundo caso, la distribución es una normal desplazada $t_1$ que tiene colas mucho más largas que la distribución normal. Para cada una de ellas simulo una muestra de tamaño $N = 50$ , 1000 veces, hacer el intervalo de confianza para cada vez, y comprobar si $\mu = 5$ está en el intervalo o no. Devuelvo la proporción de tiempo $\mu$ estaba en el intervalo, y se espera que este número sea 0,95 si se cumplen todos los supuestos.
set.seed(100)
## True value of mu
mu <- 5
reps <- 1000 # to demonstrate definition of CI
N <- 50
counting <- vector(length = reps)
## making 95% CI
for(i in 1:reps)
{
## When data is really normal and true mean is mu = 5
## So CLT hold exactly
data <- mu + rnorm(N, mean = 0, sd = 1)
mu.hat <- mean(data)
se <- sd(data)/sqrt(N)
quantile <- qt(.975, df = N-1)
upper <- mu.hat + quantile*se
lower <- mu.hat - quantile*se
## Demonstrating how many of the CIs have mu in them
counting[i] <- ifelse(upper > mu && lower < mu, 1, 0)
}
mean(counting)
# [1] 0.946
counting <- vector(length = reps)
## making 95% CI
for(i in 1:reps)
{
## When data is from t distribution and true mean is still mu = 5
## With N = 100 CLT is only approximate
data <- mu + rt(N, df = 1)
mu.hat <- mean(data)
se <- sd(data)/sqrt(N)
quantile <- qt(.975, df = N-1)
upper <- mu.hat + quantile*se
lower <- mu.hat - quantile*se
## Demonstrating how many of the CIs have mu in them
counting[i] <- ifelse(upper > mu && lower < mu, 1, 0)
}
mean(counting)
# [1] 0.986
La primera vez, me acerco mucho a .95 pero la segunda vez estoy mucho más alto. Así que sí, nuestra confianza será diferente de .95 si nuestras suposiciones no se cumplen. Sin embargo, si $N$ es grande y la distribución de los datos es cercana a la normalidad, no estará muy lejos.
3 votos
Me gustaría volver a insistir en algo que has dicho correctamente: el supuesto de normalidad se refiere a la distribución muestral de las medias, no a las alturas de la población. La distribución muestral de las medias en este ejemplo va a ser muy cercana a la Normal. Lo que hace un buen estadístico es parecido a lo que hacen los astrofísicos cuando utilizan los cálculos newtonianos para calcular las distancias a los cuerpos del sistema solar: aunque saben que ese modelo no es correcto, también saben determinar cuándo merece la pena hacer el trabajo extra de utilizar las ecuaciones más precisas de la relatividad general.
0 votos
@whuber, gracias por tu comentario. Realmente empiezo a ver que hay un verdadero arte para decidir cuándo usar qué en las estadísticas. Supongo que se necesita tanto mucha experiencia como una fuerte comprensión teórica de las matemáticas detrás de los conceptos.