11 votos

¿Cómo puedo hallar la desviación típica de la desviación típica muestral de una distribución normal?

Perdóneme si me he perdido algo bastante obvio.

Soy un físico con lo que es esencialmente una distribución (histograma) centrada alrededor de un valor medio que se aproxima a una distribución Normal. El valor importante para mí es la desviación típica de esta variable aleatoria gaussiana. ¿Cómo puedo tratar de encontrar el error en la desviación estándar de la muestra? Tengo la sensación de que es algo que ver con el error en cada bin en el histograma original.

41voto

mat_geek Puntos 1367

La cantidad $X=(n-1) s^2/\sigma^2$ tiene una distribución chi-cuadrado con $n-1$ grados de libertad cuando las muestras son independientes y se distribuyen con la misma distribución normal Esta cantidad se puede utilizar para obtener intervalos de confianza para la varianza de la normal y su desviación típica. Si se dispone de los valores brutos y no sólo del valor central de los bins se puede calcular $s^2$ .

Se sabe que si $X$ tiene una distribución chi-cuadrado con $n-1$ grados de libertad su varianza es $2(n-1)$ . Sabiendo esto y el hecho de que el $\mathrm{Var}(cX) = c^2 \mathrm{Var}(X)$ obtenemos que $s^2$ tiene una varianza igual a $$\frac{2(n-1)\sigma^4}{(n-1)^2} =\frac{2\sigma^4}{n-1} \>.$$ Aunque $\sigma^4$ es desconocido, puede aproximarlo mediante $s^4$ y tienes una idea aproximada de cuál es la varianza de $s^2$ es.

12voto

Niall Puntos 51

Parece que pides un cálculo de la desviación típica de la desviación típica de la muestra. Es decir, estás pidiendo ${\rm SD}(s) = \sqrt{ {\rm var}(s) }$ donde

$$ s = \sqrt{ \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X}) }, $$

$X_1, ..., X_n \sim N(\mu, \sigma^2)$ y $\overline{X}$ es la media muestral.

En primer lugar, sabemos por las propiedades básicas de la varianza que

$$ {\rm var}(s) = E(s^2) - E(s)^2 $$

Como la varianza de la muestra es insesgada, sabemos que $E(s^2) = \sigma^2$ . En ¿Por qué la desviación típica de la muestra es un estimador sesgado de $\sigma$ ? , $E(s)$ de lo que se deduce

$$ E(s)^2 = \frac{2 \sigma^2 }{n-1} \cdot \left( \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) } \right)^2 $$

por lo tanto

$$ {\rm SD}(s) = \sqrt{ E(s^2) - E(s)^2 } = \sigma \sqrt{ 1 - \frac{2}{n-1} \cdot \left( \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) } \right)^2 } $$

9voto

Hay varias formas de cuantificar el error de la desviación típica en el caso normal. Voy a presentar el perfil de probabilidad de $\sigma$ que puede utilizarse para aproximar intervalos de confianza.

Sea $x=(x_1,...,x_n)$ sea una muestra de una Normal $(\mu,\sigma)$ . La función de verosimilitud correspondiente viene dada por

$${\mathcal L}(\mu,\sigma) \propto \dfrac{1}{\sigma^n}\exp\left(-\dfrac{1}{2\sigma^2}\sum_{j=1}^n(x_j-\mu)^2\right)$$

Entonces, los estimadores de máxima verosimilitud vienen dados por $(\hat\mu,\hat\sigma)=(\bar x,s)$ donde $s=\sqrt{\dfrac{1}{n}\sum_{j=1}^n(x_j-\bar x)^2}$ . Dado que usted está interesado en cuantificar el error en $\sigma$ se puede calcular la probabilidad normalizada del perfil de este parámetro de la siguiente manera.

$$R_p(\sigma)=\dfrac{\sup_{\mu}{\mathcal L}(\mu,\sigma)}{{\mathcal L}(\hat\mu,\hat\sigma)} = \left(\dfrac{\hat\sigma}{\sigma}\right)^n\exp\left[\dfrac{n}{2}\left(1-\left(\dfrac{\hat\sigma}{\sigma}\right)^2\right)\right]$$

Tenga en cuenta que $R_p:{\mathbb R}_+\rightarrow (0,1]$ . Un intervalo de nivel $0.147$ tiene una confianza aproximada de $0.95$ . A continuación adjunto un $R$ que puede utilizarse para calcular estos intervalos. Puede modificarlo en consecuencia en su contexto (o si publica los datos puedo incluir estos cambios).

data = rnorm(30)
n = length(data)
sg = sqrt(mean((data-mean(data))^2))
# Profile likelihood
rp = function(sigma) return( (sg/sigma)^n*exp(0.5*n*(1-(sg/sigma)^2))  )
vec = rvec = seq(0.5,1.5,0.01)
for(i in 1:length(rvec)) rvec[i] = rp(vec[i])
plot(vec,rvec,type="l")
rpc = function(sigma) return(rp(sigma)-0.147)
# Approximate 95% confidence interval
c(uniroot(rpc,c(0.7,0.8))$root,uniroot(rpc,c(1.1,1.3))$root)

Una ventaja de este tipo de intervalos es que son invariables bajo transformaciones. En este caso, si se calcula un intervalo para $\sigma$ , $I=(L,U)$ entonces el intervalo correspondiente para $\sigma^2$ es simplemente $I^{\prime}=(L^2,U^2)$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X