Actualmente estoy analizando un conjunto de datos resultante de un complejo diseño de encuesta. Los individuos se han seleccionado a partir de un diseño de muestreo por conglomerados en tres etapas con dos estratos (que se han combinado para dar lugar a un estrato grande). Además, se ha estimado un factor de ponderación para garantizar la representatividad y se han producido correcciones de población finita en cada nivel (obtenidas dividiendo el número de conglomerados (o unidades) incluidos por el número potencial total de conglomerados (o unidades)).
Dado que se trata de datos de salud pública y que nuestro artículo se publicará en acceso abierto, me gustaría realizar los análisis en R para que cualquiera pueda reproducirlos. Sin embargo, aunque es bastante sencillo tener en cuenta este diseño en Stata, tuve problemas para hacerlo en R.
En stata, la sintaxis es
svyset level3cluster [pweight=WEIGHTS], strata(stratum) fpc(fpc3)
vce(linearized) singleunit(scaled) || level2cluster, fpc(fpc2) || level1unit, fpc(fpc1)
En R, he intentado pasar a través del paquete "encuesta":
Data <- svydesign(ids=~level3cluster+level2cluster+level1unit,
strata = ~stratum, weights= ~WEIGHTS,
fpc = ~fpc3+fpc2+fpc1, data=data_tot)
En esta fase, todo funciona bien. Sin embargo, cuando se sigue con:
summary(svyglm(VD~VI, design=Data, family=gaussian))
\=> Se calculan las estimaciones, pero no el SE ni los valores p.
He probado sin el fpc
y todo funcionó bien. Alguien tiene una idea de lo que está mal en mi código (o tiene una idea de otro paquete que se podría utilizar (he comprobado lme4
pero no parece diseñado para ello))?
Muchas gracias por su ayuda.