4 votos

Estimación de la desviación estándar de la población a partir de las medias de las submuestras

Me gustaría estimar la desviación estándar de una población. Los datos que tengo son el tamaño y la media de cada uno de $k$ submuestras uniformes independientes: $(n_1, \mu_1), (n_2, \mu_2), \ldots, (n_k, \mu_k)$ . Aquí, el $i$ La submuestra tiene $n_i$ elementos, y aquellos $n_i$ los elementos tienen una media de $\mu_i$ .

¿Cuál es la mejor manera de utilizar todos los $2k$ para producir la mejor estimación de la desviación estándar de la población $\sigma$ ?

5voto

jldugger Puntos 7490

Dejemos que $\mu$ sea la media de la población y $\sigma$ sea la DS de la población. Tiene observaciones $x_i$ de $k$ variables independientes $X_i$ tener un medio común $\mu$ y desviaciones $\sigma^2/n_i,$ $i=1,2,\ldots, k.$

No te comprometes con el sentido de "mejor". Para concretarlo, encontremos el estimador por mínimos cuadrados de $\sigma.$ Este es un Mínimos cuadrados ponderados problema con los pesos $1/(1/n_i)=n_i,$ de donde

$$\hat\mu = \frac{1}{n_1+n_2+\cdots+n_k}\, \left(n_1x_1 + n_2x_2 + \cdots + n_k x_k\right)$$

con residuos

$$r_i = x_i - \hat\mu$$

lo que implica

$$\hat\sigma^2 = \frac{1}{k-1}\, \left(n_1 r_1^2 + n_2 r_2^2 + \cdots + n_k r_k^2\right).$$

Por lo tanto, podemos tomar

$$\hat \sigma = \sqrt{\hat\sigma^2}$$

como una "mejor" estimación de $\sigma.$

Como comprobación, un álgebra sencilla verificará que $E[\hat\mu] = \mu$ y $E[\hat\sigma^2]=\sigma^2,$ propiedades estándar de las estimaciones por mínimos cuadrados. Como otra comprobación, estos cálculos reproducen exactamente el resultado del lm función en R utilizando el $n_i$ en su weights argumento.

1 votos

Gracias, esto tiene mucho sentido. Por cierto, creo que tienes un subíndice extra en tu ecuación residual.

0 votos

Gracias por la cuidadosa revisión. He corregido esa errata.

0 votos

He comprobado que esta pregunta parece haber sido formulada anteriormente, ¡y la respuesta más destacada ha sido la tuya! stats.stackexchange.com/q/24936/2221 ¿Debería eliminarse esta pregunta ya que es una repetición? ¿O hay algo lo suficientemente singular en esta pregunta como para justificar que se mantengan las dos?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X