Yo probablemente sólo muestra al azar con reemplazo de los Sujetos en sus datos hasta que tuve la derecha el tamaño de la muestra. Este es el método bootstrap. Es más simple que la identificación de la distribución multivariante de las variables y, a continuación, el muestreo de la misma. También el bootstrap no hacer suposiciones adicionales sobre el multivariante de la estructura de los datos.
primero establecer el número de participantes en su gran estudio simulado
nits=300
obtener el único de los participantes en el estudio pequeño
sub=unique(Orthodont$Subject)
muestra el único de los participantes de forma aleatoria con reemplazo
subs=sample(sub,nits,rep=T)
hacer vacío de un marco de datos
df=Orthodont[-(1:dim(Orthodont)[1]),]
el bucle a través de el tamaño de la muestra y se unen juntos.
for( i in 1:nits) {
df=rbind(df,Orthodont[which(Orthodont$Subject==subs[i]),])
}
Este último bucle for es lento, hay debo favorable una mejor manera de escribir.
Ahora usted puede ejecutar su regresión en el mayor conjunto de datos y ver sus intervalos de confianza más pequeño.