Processing math: 100%

1 votos

Calcular el intervalo de confianza que con probabilidad x la media de la población se encuentra dentro de ±D de la media de la muestra m cuando N>100

Supongamos que se tiene una serie de N ( N>100 ) puntos de datos muestreados de una población con distribución desconocida. μ la media de la población, y σ2 la varianza de la población, son ambos desconocidos.

Me gustaría encontrar el intervalo D en torno a la media de la muestra m , de tal manera que P(mD<μ<m+D)=x . En otras palabras, la probabilidad de que μ se encuentra a poca distancia D de m es x .

Como no conozco la verdadera varianza poblacional, sólo tengo una estimación de la misma a través de la varianza muestral, que llamo s2 . Esto significa que sólo tengo una estimación del error estándar s/N .

Esto significaría que habría que utilizar la distribución t de Student para determinar D . Sin embargo, la Wikipedia tiene el siguiente comentario:

Nota: La distribución de probabilidad de Student se aproxima bien a la distribución de Gauss cuando el tamaño de la muestra es superior a 100. Para tales muestras se puede utilizar esta última distribución, que es mucho más sencilla.

¿Significa esto que en mi caso de uso, puedo asumir efectivamente que s2 es una excelente aproximación a σ2 y así proceder con los pasos que uno usaría si supiera σ2 para determinar el intervalo de confianza?

2voto

Vitaly Zdanevich Puntos 95

Si σ es conocida, se utiliza la distribución gaussiana. Cuando se desconoce, para tener en cuenta la incertidumbre sobre los posibles σ 's, se utiliza la distribución student-t. Entonces, el problema es la varianza desconocida. Cuando la distribución student-t está bien aproximada por la gaussiana con muestras grandes, el problema de la incertidumbre sobre σ disminuye y las dos distribuciones se acercan. Por supuesto, esto significa una mejor aproximación a σ sin embargo, no es una excelente aproximación (por ejemplo, ni siquiera tendrías aún excelente aproximación a la media, N=100 es bastante pequeño). La esencia aquí es la incertidumbre sobre σ disminuye hasta un nivel tal que no afecta a la distribución de la media de forma significativa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X