1 votos

Calcular el intervalo de confianza que con probabilidad $x$ la media de la población se encuentra dentro de $\pm D$ de la media de la muestra $m$ cuando $N > 100$

Supongamos que se tiene una serie de $N$ ( $N > 100$ ) puntos de datos muestreados de una población con distribución desconocida. $\mu$ la media de la población, y $\sigma^2$ la varianza de la población, son ambos desconocidos.

Me gustaría encontrar el intervalo $D$ en torno a la media de la muestra $m$ , de tal manera que $P(m - D < \mu < m + D) = x$ . En otras palabras, la probabilidad de que $\mu$ se encuentra a poca distancia $D$ de $m$ es $x$ .

Como no conozco la verdadera varianza poblacional, sólo tengo una estimación de la misma a través de la varianza muestral, que llamo $s^2$ . Esto significa que sólo tengo una estimación del error estándar $s/\sqrt{N}$ .

Esto significaría que habría que utilizar la distribución t de Student para determinar $D$ . Sin embargo, la Wikipedia tiene el siguiente comentario:

Nota: La distribución de probabilidad de Student se aproxima bien a la distribución de Gauss cuando el tamaño de la muestra es superior a 100. Para tales muestras se puede utilizar esta última distribución, que es mucho más sencilla.

¿Significa esto que en mi caso de uso, puedo asumir efectivamente que $s^2$ es una excelente aproximación a $\sigma^2$ y así proceder con los pasos que uno usaría si supiera $\sigma^2$ para determinar el intervalo de confianza?

2voto

Vitaly Zdanevich Puntos 95

Si $\sigma$ es conocida, se utiliza la distribución gaussiana. Cuando se desconoce, para tener en cuenta la incertidumbre sobre los posibles $\sigma$ 's, se utiliza la distribución student-t. Entonces, el problema es la varianza desconocida. Cuando la distribución student-t está bien aproximada por la gaussiana con muestras grandes, el problema de la incertidumbre sobre $\sigma$ disminuye y las dos distribuciones se acercan. Por supuesto, esto significa una mejor aproximación a $\sigma$ sin embargo, no es una excelente aproximación (por ejemplo, ni siquiera tendrías aún excelente aproximación a la media, $N=100$ es bastante pequeño). La esencia aquí es la incertidumbre sobre $\sigma$ disminuye hasta un nivel tal que no afecta a la distribución de la media de forma significativa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X