8 votos

Extraño patrón de desviación estándar intervalo de confianza de la estimación a través de bootstrap

Yo quería estimación intervalo de confianza para la desviación estándar para algunos datos. R código es como sigue:

library(boot)
sd_boot <- function (x, ind) {                
        res <- sd(x$ReadyChange[ind], na.rm = TRUE)
        return(res)            
}
data_boot <- boot::boot(data, statistic = sd_boot, R = 10000)
plot(data_boot)

Y tengo el siguiente diagrama: enter image description here

Estoy atascado con la interpretación de este histograma de carga correctamente. Cada otro conjunto de datos similares muestra las distribuciones normales de estimaciones bootstrap... Pero no esta. Por cierto, esto es real datos en bruto:

> data$ReadyChange
 [1] 27.800000  8.985046 11.728021  8.830856  5.738600 12.028310  7.771528  9.208924 11.778611  6.024259  5.969931  6.063484  4.915764
[14] 12.027639  9.111146 13.898171 12.921377  6.916667 10.764479  6.875000 12.875000  7.017917  9.750000  7.921782 12.911551  6.000000

Puede usted por favor me ayude con la interpretación de este bootstrap patrón?

21voto

Arrix Puntos 135

Usted podría tener un error en su código, o el arranque de la biblioteca hace algo más de lo esperado.

Editar:

Después de corregidos los datos, se hizo evidente que el patrón fue causada por un valor atípico, con cada pico correspondiente a la diferente número de veces que el valor atípico fue seleccionado en una muestra.

enter image description here

8voto

IWS Puntos 126

Soy reacia a poner esto como una respuesta, pero esto me parece ser causado por la pequeña cantidad de puntos de datos que la base de su arranque en (21, corríjanme si estoy equivocado).

Para ser más precisos, a mí me parece que estos específicos de 21 de valores, desde la que se muestra, sólo unos pocos frecuentemente posibles desviaciones estándar (de los picos en el histograma). Si la base de la muestra era más grande y más diversa, el histograma resultante sería mucho más suave (y probablemente más semejante a la de la distribución normal que se esperaban).

En una nota general y suponiendo que en el derecho aquí, este es un buen ejemplo para mostrar el "bootstrapping" no resuelve los problemas de tener una pequeña muestra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X