5 votos

¿Por qué aplicamos la versión de la media muestral del CLT para un problema que implica un tamaño de muestra de 1?

Tengo problemas para entender la siguiente pregunta y respuesta. Me parece que el tamaño de la muestra es n = 1 y el tamaño de la población es N=500. Si lo leo así, entonces no tenemos una muestra lo suficientemente grande como para utilizar el CLT. La respuesta utiliza n=500 pero esto también es N, por lo que ¿no implica que la media es seguramente de 750 dólares?

Pregunta

Un pequeño banco de microcréditos tiene 500 clientes de préstamos. Si el total anual de de un individuo es una variable aleatoria con media 750 dólares y una desviación típica de 900 dólares. Aproximar la probabilidad de que la promedio de los reembolsos anuales totales realizados por todos los clientes sea mayor que 755 dólares.

Respuesta

Aplicar la (versión media de la muestra) CLT utilizando $(750,900^2/500)=(750,1620)$ .

El valor z para esto es $\frac{755750}{\sqrt{1620}}=0.1242$ .

Buscando esto en la tabla Z el valor más cercano es 0,12 que corresponde a una probabilidad de (<0,12)=0,5478 .

Por lo tanto, la probabilidad de que los pagos totales medios anuales sean mayores que 755 dólares es aproximadamente:

(>755)=(>0.12)=1(<0.12)=10.5478=0.4522 .

4voto

Aaron Puntos 36

Este es un ejemplo de pregunta mal formulada. Si se interpreta estrictamente como está escrita, se tiene un tamaño de muestra de $n=500$ y un tamaño de población de $N=500$ Así que sí, la media de la población es seguramente \$750 (and so the probability that this mean is greater than \$ 755 se sabe que es cero). Si se diera esta respuesta a la pregunta, sería correcta en mi opinión. Sin embargo, a la vista de la respuesta dada, parece que el autor de la pregunta pretendía tratar la muestra de $n=500$ clientes como una muestra aleatoria de una población "grande" ( $N=\infty$ ) y los cálculos resultantes son coherentes con ello.

Para este tipo de preguntas, vale la pena señalar que la fórmula del intervalo de confianza para una media poblacional puede escribirse de manera que permita una población finita o infinita $n \leqslant N \leqslant \infty$ . La fórmula general para el intervalo de confianza de la media de la población (véase, por ejemplo, O'Neill 2014 , pp. 285-286) es:

$$\text{CI}_N(1-\alpha) = \Bigg[ \bar{x}_n \pm \frac{t_{\alpha/2,DF_n}}{n} \cdot \sqrt{\frac{N-n}{N}} \cdot s_n \Bigg],$$

donde $DF_n = n-1$ para una distribución mesocúrtica (por ejemplo, la distribución normal). Se puede confirmar fácilmente que este intervalo se reduce a un único punto dado por la media muestral en el caso especial en que $n=N$ y se reduce a la forma estándar utilizada para una población "grande" cuando $N=\infty$ .

3voto

manku Puntos 111

El primer comentario de @COOLSerdash es correcto. La redacción del problema es algo confusa.

Además, la elección de los números conduce a un valor z que necesita ser redondeado para el uso de una tabla impresa, por lo que obtenemos un notable error de redondeo en la respuesta publicada.

Usted tiene $\bar X =\bar X_{500} \sim\mathsf{Norm}(\mu=750, \,\sigma=900/\sqrt{500}),$ y buscas $P(\bar X > 755) = 1-P(\bar X \le 755) = 0.4505682,$ exactamente. (Usando R:)

1 - pnorm(755, 750, 900/sqrt(500))
[1] 0.4505682

Si se estandariza, entonces $z = 0.124226.$

z = (755-750)/(900/sqrt(500)); z
[1] 0.124226

Entonces la respuesta exacta es $P(Z > z) = 1 - P(Z \le z) =0.4505682,$ exactamente (igual que el anterior). Así que no hay esencial error de estandarización.

1 - pnorm(z)
[1] 0.4505682

enter image description here

Sin embargo, al utilizar tablas impresas sin interpolación, hay que redondear $z$ a dos lugares para entrar en una tabla que redondea las probabilidades a cuatro lugares. Como en la "respuesta" publicada, usted obtendría $0.4522,$ que resulta de redondear dos veces.

round(1 - pnorm(round(z,2)), 4)
[1] 0.4522

Puede haber poca diferencia práctica entre 0,4506 (correcto a cuatro posiciones) y 0,4522. Pero puede ser frustrante utilizar un software de tareas mal diseñado software de deberes mal diseñado que requiere resultados "correctos a cuatro lugares", si usted Si se da el valor correcto a cuatro posiciones y el software emula el uso impreciso de las tablas impresas. uso de las tablas impresas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X