3 votos

Cómo hacer un intervalo de confianza bootstrap para un gran conjunto de datos

Supongamos que queremos calcular el intervalo de confianza del valor medio. Si el conjunto de datos es masivo ( $n$ muestras), el bootstrapping clásico es difícil de aplicar ya que el tamaño de la remuestra debe ser $n$ .

Pero si vuelvo a muestrear el conjunto de datos con un tamaño menor $k$ la varianza de la distribución bootstrap será diferente de la original. ¿Puedo simplemente dividirla por $\frac{n}{k}$ ? ¿Hay algún consejo para elegir $k$ ?

Gracias.

2voto

Mohammadreza Puntos 1964

Aunque el bootstrap clásico requiere volver a muestrear para $n$ muestras, pero esto no siempre es necesario, especialmente si tiene un conjunto de datos grande.

Debe establecer $k$ hasta el tamaño que pueda manejar computacionalmente.

El error estándar de la media de la muestra se define como

enter image description here

Si su k ( $n$ en la fórmula) es lo suficientemente grande, su media muestral debería ser insesgada y su intervalo de confianza debería ser lo suficientemente pequeño prácticamente.

1voto

Kamal Puntos 363

Si su muestra es lo suficientemente grande, podría utilizar simplemente el Teorema del Límite Central para derivar su intervalo de confianza de la media.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X