Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

5 votos

Por qué areny mi confianza del 95% intervalos simétricos alrededor de la media?

Estoy tratando de calcular el 95% de intervalos de confianza en torno a un valor medio mediante un procedimiento de arranque, desde el mosaico pacakge, lidiar con algunas hipótesis de problemas en mis datos. El código de abajo parece que funciona muy bien; sin embargo, los rendimientos no simétrico de los intervalos de confianza alrededor de la media. Este parece mal para mí, pero no puedo averiguar dónde está el error puede mentir.

Pregunta 1: ¿hay un error en mi formato del código que pueda producir este resultado?
Pregunta 2: ¿Puede explicar por qué los intervalos de confianza no sería simétrica alrededor de la media? (Sé que este no es un stats foro, pero yo creo que puede ser un problema de codificación, así que lo publicado aquí)

   rb12<-subset(data3,year=="pre")
    rb12

    RB12xbar <- mean(~rb12N, data = rb12)
    RB12xbar

    do(5)*resample(rb12)

    mean(~rb12N,data=resample(rb12))
    do(5)*mean(~rb12N,data=resample(rb12))

    rb12trials<- do(1000)*mean(~rb12N,data=resample(rb12))
    histogram(~result, data=rb12trials,xlab="Mean data",col="gray")

    confint(rb12trials, level=0.95,method="quantile")

a continuación es una selección de los resultados en el código anterior, así como los datos que se utilizan en ella

   year  rb12N
1   pre 2.5390
2   pre 1.3241
3   pre 3.2659
4   pre 3.4864
5   pre 3.5254
6   pre 3.1138
7   pre 3.8610
8   pre 3.9623
9   pre 3.7300
10  pre 2.6925
11  pre 2.6095
12  pre 3.0573
13  pre 3.2646
14  pre 2.7921
15  pre 3.3147
16  pre 2.6095
17  pre 3.2073
18  pre 3.3153
> RB12xbar
[1] 3.092817
> confint(rb12trials, level=0.95,method="quantile")
    name    lower    upper level   method
1 result 2.808446 3.341967  0.95 quantile

5voto

Pat Puntos 140

El Teorema del Límite Central establece que la distribución de la media muestral se aproxima a una distribución normal, como el tamaño de la muestra aumenta. Aquí está el remuestreo de una muestra muy pequeña, n=18, por lo que la CLT no se aplica. El número de bootstrap remuestrea permitirá una mejor o peor aproximación de la distribución de la media muestral, sino que la distribución no necesita ser aproximadamente normal, a menos que exista una suficientemente amplia muestra de la subyacente de la población desde la que volver a muestrear.

Su histograma de la bootstrap decir con estos datos no deben aparecer normal. Aquí está el que yo tengo, tenga en cuenta que la inclinación,

histogram of bootstrap mean

a partir de la codificación en la base de .

boot<-function(x,FUN=mean,n=1000) replicate(n,FUN(sample(x,replace=TRUE)))
set.seed(1)
x<-rb12$rb12N
b<-boot(x)
hist(b,main="Histogram of bootstrap mean")
quantile(ecdf(b),c(0.05,0.95))
#      5%      95% 
#2.840431 3.317798 

En este caso particular, el pequeño tamaño de la muestra contiene un "outlier", 1.3241, significativamente fuera de la gama de la mayoría de los puntos de datos que contribuye al efecto.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X