22 votos

¿Por qué no siempre el uso de bootstrap de la Cei?

Me preguntaba cómo bootstrap CIs (y BCa en barticular) realizar normalmente distribuido de datos. No parece ser un montón de trabajo a examinar su rendimiento en diferentes tipos de distribuciones, pero no pude encontrar nada en el que normalmente distribuido de datos. Pues parece una cosa obvia para el estudio de la primera, supongo que los papeles son demasiado viejos.

Hice algunas simulaciones de Monte Carlo utilizando el R de inicio de paquete y encontró bootstrap CIs estar de acuerdo con exacta de la Cei, aunque para muestras pequeñas (N<20) tienden a ser un poco liberal (menor CIs). Para grandes muestras suficientes, son esencialmente las mismas.

Esto hace que me pregunte si hay alguna buena razón que no siempre el uso de bootstrap. Dada la dificultad de evaluar si la distribución es normal, y las muchas trampas detrás de esto, parece razonable no decidir y el informe de bootstrap CIs, independientemente de la distribución. Entiendo que la motivación para la no utilización de pruebas no paramétricas de forma sistemática, ya que tienen menos poder, pero mi simulaciones me dicen que esto no es el caso para el bootstrap de la Cei. Son incluso más pequeñas.

Una pregunta similar que me molesta es por que no siempre utilizar la mediana como medida de tendencia central. La gente a menudo se recomienda para el uso que se caracterizan no normal de los datos distribuidos, pero puesto que la mediana es el mismo que la media normal de los datos distribuidos, ¿por qué hacer una distinción? Parece bastante beneficioso si pudiéramos deshacernos de los procedimientos para decidir si la distribución es normal o no.

Estoy muy curioso acerca de sus pensamientos sobre estos temas, y si se ha discutido antes. Referencias sería muy apreciada.

Gracias!

Pierre

8voto

mmmmmmmmmm Puntos 117

Es beneficioso tener en cuenta la motivación para la BCa intervalo y mecanismos (es decir, los llamados "factores de corrección"). El BCa intervalos son uno de los aspectos más importantes de la bootstrap porque son el caso más general de la Bootstrap Percentil Intervalos (es decir, el intervalo de confianza basado exclusivamente en la distribución bootstrap).

En particular, la relación entre la BCa intervalos y el Bootstrap Percentil Intervalos de tiempo: cuando el ajuste de la aceleración (el primer "factor de corrección") y asimetría (el segundo "factor de corrección") son ambos cero, entonces la BCa intervalos de volver a la típica Bootstrap Percentil Intervalo.

No creo que sería una buena idea usar SIEMPRE el arranque. Bootstrap es una técnica robusta que tiene una variedad de mecanismos (ex: intervalos de confianza y hay diferentes variaciones de la secuencia de arranque para los diferentes tipos de problemas, tales como el wild bootstrap cuando hay heterocedasticidad) para ajustar para diferentes problemas (ej: no-normalidad), pero es depende de uno crucial suposición: los datos representan con exactitud la verdad de la población.

Esta suposición, aunque simple en la naturaleza, puede ser difícil para comprobar especialmente en el contexto de tamaños de muestra pequeños (puede ser a pesar de que una pequeña muestra es un reflejo exacto de la verdad de la población!). Si la muestra original en el que el bootstrap de distribución (y por lo tanto, todos los resultados que se derivan de ella) no está suficientemente precisa, a continuación, los resultados (y por lo tanto su decisión en base a los resultados) serán defectuosos.

CONCLUSIÓN: Hay un montón de ambigüedad con el bootstrap y usted debe tener cuidado antes de aplicarlo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X