8 votos

Puede bootstrap re-muestreo de ser un re-muestra de un tamaño más pequeño

estoy tratando de ejecutar un pequeño ejemplo de mi regresión de datos de panel , porque es una bastante grande de regresión (efecto Fijo, de selección de heckman) y se tarda 4 horas para que se ejecute cada vez.

Estoy interesado para estimar el error estándar robusto de mi modelo. Sin embargo, no quiero volver a crear mi conjunto de datos del mismo tamaño.

  1. Primera pregunta , si puedo ejecutar un arranque en datos de panel, puedo volver a la muestra de las filas o de las personas físicas ?
  2. Puedo construir una muestra más pequeña en bootstrap ? Tradicionalmente en los libros de texto , boostrap de tamaño N siempre requiere un re-muestra de tamaño N

Gracias

5voto

Bill Puntos 3605

A tu primera pregunta, sí. Esto se llama el bloque de arranque. En cualquier momento que usted piensa que usted tiene dependencias en sus datos, usted debe bootstrap grupos de observaciones para la captura de las dependencias. Las cosas que son de arranque debe ser independiente.

A su segunda pregunta, la respuesta también es sí. Puedes realizar un muestreo de la mitad de grande, si quieres. Esto no le dará corregir los errores estándar de curso. Esto le dará los errores estándar correctos para una muestra de la mitad de grande. Tal vez, en su aplicación, se puede demostrar analíticamente que los errores estándar son proporcionales a $1/\sqrt{N}$. En ese caso, podría arrancar un ejemplo de un cuarto tan grande, el error que te interesan, y luego se multiplica por un factor de $1/2$.

Finalmente, cuatro horas no es mucho tiempo. Si usted consigue el modelo exacto que usted desea, un 100 replicación bootstrap es sólo va a tomar 400 horas. Que 400/24 = 17 días. ¿Cuál es el problema con eso? Es menos de un mes. Dividir la muestra por 4 sólo se va a reducir a 4 días.

También, se están tomando ventaja de procesamiento en paralelo? No sé cómo se ejecuta su análisis o cómo va a bootstrap, pero el arranque está sobre la mayoría de los parallelizable cosa que nunca. Con suficiente procesadores (100), podría hacer todo el bootstrap en 4 horas. Esto es muy plausible si usted tiene acceso a una computación de alto rendimiento del clúster. Incluso sin que, probablemente, usted puede acelerar las cosas por un factor de cuatro sólo a través de su equipo de escritorio correctamente. Es probable que consiguió varios procesadores cada uno de los cuales es probable que pueda hacer más de una cosa a la vez.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X