Primero que todo, me gustaría comprobar si la media es un índice adecuado para la tarea a mano. Si usted está en busca de "un típico/ o valor central" de una distribución sesgada, la media podría apuntar a un lugar de no-valor representativo. Considere la posibilidad de la log-normal de distribución:
x <- rlnorm(1000)
plot(density(x), xlim=c(0, 10))
abline(v=mean(x), col="red")
abline(v=mean(x, tr=.20), col="darkgreen")
abline(v=median(x), col="blue")
La media (línea roja) está bastante lejos de la mayor parte de los datos. 20% tapizados media (verde) y la mediana (azul) están más cerca de la "típica" de valor.
Los resultados dependen del tipo de "no-normal" de la distribución (un histograma de los datos reales sería útil). Si no es sesgada, pero ha pesado de cola, su Cei será muy amplia.
En cualquier caso, creo que el "bootstrapping", de hecho, es una buena aproximación, ya que también puede dar asimétrica de la Cei. El R
paquete simpleboot
es un buen comienzo:
library(simpleboot)
# 20% trimmed mean bootstrap
b1 <- one.boot(x, mean, R=2000, tr=.2)
boot.ci(b1, type=c("perc", "bca"))
... te da el siguiente resultado:
# The bootstrap trimmed mean:
> b1$t0
[1] 1.144648
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 2000 bootstrap replicates
Intervals :
Level Percentile BCa
95% ( 1.062, 1.228 ) ( 1.065, 1.229 )
Calculations and Intervals on Original Scale