Me preguntaba cómo bootstrap CIs (y BCa en barticular) realizar normalmente distribuido de datos. No parece ser un montón de trabajo a examinar su rendimiento en diferentes tipos de distribuciones, pero no pude encontrar nada en el que normalmente distribuido de datos. Pues parece una cosa obvia para el estudio de la primera, supongo que los papeles son demasiado viejos.
Hice algunas simulaciones de Monte Carlo utilizando el R de inicio de paquete y encontró bootstrap CIs estar de acuerdo con exacta de la Cei, aunque para muestras pequeñas (N<20) tienden a ser un poco liberal (menor CIs). Para grandes muestras suficientes, son esencialmente las mismas.
Esto hace que me pregunte si hay alguna buena razón que no siempre el uso de bootstrap. Dada la dificultad de evaluar si la distribución es normal, y las muchas trampas detrás de esto, parece razonable no decidir y el informe de bootstrap CIs, independientemente de la distribución. Entiendo que la motivación para la no utilización de pruebas no paramétricas de forma sistemática, ya que tienen menos poder, pero mi simulaciones me dicen que esto no es el caso para el bootstrap de la Cei. Son incluso más pequeñas.
Una pregunta similar que me molesta es por que no siempre utilizar la mediana como medida de tendencia central. La gente a menudo se recomienda para el uso que se caracterizan no normal de los datos distribuidos, pero puesto que la mediana es el mismo que la media normal de los datos distribuidos, ¿por qué hacer una distinción? Parece bastante beneficioso si pudiéramos deshacernos de los procedimientos para decidir si la distribución es normal o no.
Estoy muy curioso acerca de sus pensamientos sobre estos temas, y si se ha discutido antes. Referencias sería muy apreciada.
Gracias!
Pierre