TLDR. 10.000 parece ser una buena regla general, por ejemplo, los valores p de este tamaño o de un número mayor de muestras bootstrap estarán dentro del 0,01 del "verdadero valor p" del método aproximadamente el 95% de las veces.
A continuación sólo considero el enfoque de bootstrap percentil, que es el método más utilizado (hasta donde yo sé), pero también Hay que admitir que tiene puntos débiles y que no debería utilizarse con muestras pequeñas .
Reencuadre ligeramente. Puede ser útil calcular la incertidumbre asociada a los resultados del bootstrap para tener una idea de la incertidumbre resultante del uso del bootstrap. Tenga en cuenta que esto no aborda las posibles debilidades del bootstrap (por ejemplo, véase el enlace anterior), pero ayuda a evaluar si hay "suficientes" muestras de bootstrap en una aplicación concreta. En general, el error relacionado con el tamaño de la muestra bootstrap n
llega a cero a medida que n
va hasta el infinito, y la pregunta que se hace es cuán grande debe ser n
para que el error asociado al pequeño tamaño de la muestra bootstrap sea pequeño?
Incertidumbre Bootstrap en un valor p. La imprecisión en un valor p estimado, digamos que pv_est es el valor p estimado a partir del bootstrap, es de aproximadamente 2 x sqrt(pv_est * (1 - pv_est) / N)
, donde N
es el número de muestras bootstrap. Esto es válido si pv_est * N
et (1 - pv_est) * N
son ambos >= 10
. Si uno de ellos es menor que 10, entonces es menos preciso pero muy aproximadamente en el mismo vecindario que esa estimación.
Error de Bootstrap en un intervalo de confianza. Si se utiliza un intervalo de confianza del 95%, entonces observe la variabilidad de los cuantiles de la distribución bootstrap cerca del 2,5% y del 97,5% comprobando los percentiles en (para el percentil 2,5) 2.5 +/- 2 * 100 * sqrt(0.025 * 0.975 / n)
. Esta fórmula comunica la incertidumbre del extremo inferior del intervalo de confianza del 95% en función del número de muestras bootstrap tomadas. Debería hacerse una exploración similar en el extremo superior. Si esta estimación es algo volátil, ¡asegúrese de tomar más muestras bootstrap!
3 votos
Yo también tengo curiosidad por esto, ya que estoy planeando un análisis de simulación. ¿Hay alguna razón para no tomar tantas muestras como sea posible/práctico? Aparte de las preocupaciones ambientales (por ejemplo, el gasto de electricidad) y las preocupaciones personales (por ejemplo, la superación de los umbrales críticos para la frialdad sostenible, la transición hacia el frikismo puro ), no veo ninguna contraindicación en las respuestas hasta el momento (+1 a todos por cierto)...
6 votos
@Nick Estoy en gran medida de acuerdo - por lo general uso tantos como puedo permitirme esperar (por lo general hasta un millón, aunque no siempre), pero normalmente considero 1000 como un límite inferior bastante claro. Como primer intento, a menudo hago 1K para obtener información de tiempo, y luego calcular cuántos múltiplos de eso estoy dispuesto a esperar para la respuesta real.
1 votos
Si la parte del proceso que consume tiempo es la generación de simulaciones, y las observaciones de las mismas pueden agregarse fácilmente (como a menudo pueden hacerlo con un poco de codificación adicional), parece que hay pocas excusas para no pecar de exceso. Supongo que podría irse de las manos con el tiempo si la gente lo hiciera y se olvidara de por qué, pero como probablemente nunca va a ser el caso... Tener un umbral mínimo al que la gente aspira innecesariamente parece un poco contraproducente, si la alternativa -sólo ir a por más hasta que realmente no quede espacio para la duda- se desalienta implícitamente.
2 votos
Yo sólo hago un bootstrap hasta que veo una clara convergencia. Si quieres aliviar las preocupaciones de los revisores, yo incluiría una visualización de las iteraciones del bootstrap frente a la estimación resultante para ilustrar la convergencia.
0 votos
North et al. 2002 proporciona algunas directrices que he encontrado útiles DOI: 10.1086/341527 [ [ncbi.nlm.nih.gov/pmc/articles/PMC379178/pdf/AJHGv71p439.pdf]](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC379178/pdf/AJHGv71p439.pdf])