1 votos

Enfoques de remuestreo en problemas con múltiples muestras

Soy nuevo en Bootstrap y necesitaría una explicación sobre las técnicas de remuestreo para comparar dos poblaciones. Supongamos que tenemos dos muestras, de tamaños de muestra respectivos $n_1$ y $n_2$. El número total de individuos es $n = n_1 + n_2.

Queremos usar una técnica de bootstrap/remuestreo para comparar una estadística dada (por ejemplo, el coeficiente de variación) entre estas dos muestras.

Existe el enfoque estándar: dibujando con reemplazo $B$ muestras de bootstrap de tamaños de muestra respectivos $n_1$ y $n_2$, calculando la estadística en cada muestra de bootstrap, etc.

Podría haber otro enfoque: dibujar (aún con reemplazo) directamente $B$ muestras de bootstrap de $n$ individuos de la muestra total, independientemente de los grupos. Y luego, calcular $B$ veces la estadística en cada subgrupo, etc.

Mi intuición es que el segundo enfoque es defectuoso, pero no podría explicar por qué de manera formal. ¿Es aceptable tal enfoque en algunos casos / para algunas estadísticas, o siempre es incorrecto, y por qué?

¡Gracias!

0voto

V. Romanov Puntos 904

A menos que las dos poblaciones tengan las mismas características, sería incorrecto tomar las B muestras bootstrap independientemente del grupo. Como ejemplo, si su conjunto de muestras fuera el salario promedio de un profesional de 25 años, estos datos podrían variar significativamente según la industria y la geografía en la que se encuentre el profesional.

Dada la divergencia, no tendría mucho sentido agrupar todas las muestras en una sola población. Por la misma razón, no tendría sentido recolectar las muestras bootstrap a través de todas las poblaciones diferentes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X