5 votos

Más detalles sobre el procedimiento bootstrap para calcular el intervalo de confianza de muestra SD

Originalmente me hizo la pregunta en este post, donde me explicó que sólo tengo 25 medidas a mi disposición. Por lo tanto, el cálculo de la muestra SD $\sigma_x$ y asumir que es el de la distribución parece ser muy optimista y me quiere calcular un intervalo de confianza.

Me sugirieron utilizar el método de bootstrapping, pero no estoy seguro exactamente cómo usarlo; creo que se tendría que proceder de la siguiente manera:

  • hacer algún supuesto sobre la distribución de probabilidad subyacente detrás de mi muestra, por ejemplo, supongo que es normal, y aplicar el parámetro I estimado : $\mathcal{N}(s, \sigma_x)$
  • Generar $n$ muestras de tamaño 25 (precisamente el mismo tamaño de mi muestra original)
  • Calcular la muestra desviación estándar de cada uno de los 25
  • Y, a continuación, busque en el (85%), que son los más cercanos a la media; todos ellos estarán en el 85% de intervalo.

Supongo que tengo derecho , pero me tienen que hacer una suposición sobre la distribución subyacente, lo que realmente me gustaría evitar.

Hay otra manera de ir, o no me malinterprete algo?

7voto

Sí, se ha perdido algo, o más bien añade algo. Usted está haciendo bootstrap paramétrico, que sólo es apropiada si usted sabe algo sobre el tipo de distribución que usted espera. Además, se había estimado que la distribución paramétrica utilizando el mle. En su caso, donde no tienen idea de la distribución, de salir de la suposición de normalidad y de uso simple caso de remuestreo. Obtener la muestra a partir de los datos, no desde la teoría de la distribución. Así que acaba de volver a muestrear 25 de la muestra de 25 CON la sustitución. Hacer que un gran número de veces y puede generar un intervalo de confianza. Si puedo asumir que sus datos y , a continuación, en R el código general podrían ser....

library(boot)
sdb <- function(y, i) sd(y[i])  #boot needs a function of y that can index y
b <- boot(y, sdb, 1000)
boot.ci(b)

Pero, es posible que prefiera para hacer un sencillo ejemplo más explícito de los medios y, por tanto, ver lo que realmente está pasando y jugar con las entrañas de ella. Tenga en cuenta que b a continuación no es la misma cosa como b por encima.

b <- sapply( 1:1000, function(x) {
    s <- sample(y, 25, replace = TRUE)
    sd(s) } )
b <- sort(b)
#low end of CI
b[25]
#hi end of CI
b[975]

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X