Diferenciaré los análisis que utilizan errores estándar basados en el modelo frente a los robustos refiriéndome a estos últimos como "GEEs", que es de hecho una definición intercambiable. Además de la fantástica explicación de Scortchi:
Los GEE pueden estar "sesgados" en muestras pequeñas, es decir, de 10 a 50 sujetos: (Lipsitz, Laird y Harrington, 1990; Emrich y Piedmonte, 1992; Sharples y Breslow, 1992; Lipsitz et al., 1994; Qu, Piedmonte y Williams, 1994; Gunsolley, Getchell y Chinchilli, 1995; Sherman y le Cessie, 1997). Cuando digo que los GEEs están sesgados lo que quiero decir es que la estimación del error estándar puede ser conservadora o anticonservadora debido a recuentos de células pequeños o nulos, dependiendo de qué valores ajustados muestren este comportamiento y de lo consistentes que sean con la tendencia general del modelo de regresión.
En general, cuando el modelo paramétrico está correctamente especificado, se siguen obteniendo estimaciones correctas del error estándar a partir de los IC basados en el modelo, pero el objetivo de utilizar la GEE es dar cabida a ese gran "si". Las GEE permiten al estadístico simplemente especificar un modelo de probabilidad de trabajo para los datos, y los parámetros (en lugar de ser interpretados en el marco estrictamente paramétrico) se consideran un tipo de "tamiz" que puede generar valores reproducibles independientemente del mecanismo subyacente y desconocido de generación de datos. Este es el corazón y el alma del análisis semiparamétrico, del que un GEE es un ejemplo.
Los GEEs también manejan las fuentes de covariación no medidas en los datos, incluso con la especificación de una matriz de correlación independiente. Esto se debe al uso de la matriz de covarianza empírica en lugar de la basada en el modelo. En la modelización de Poisson, por ejemplo, podría estar interesado en las tasas de fertilidad de los salmones muestreados en varios arroyos. Los óvulos recolectados de las hembras podrían tener una distribución de Poisson subyacente, pero la variación genética que comprende la heretibilidad compartida y los recursos disponibles en arroyos específicos podría hacer que los peces dentro de esos arroyos sean más similares que entre otros arroyos. La GEE dará estimaciones correctas del error estándar de la población siempre que la tasa de muestreo sea coherente con su proporción poblacional (o esté estratificada de otra manera).