Estoy un poco confundido sobre las ventajas de los modelos mixtos con respecto a la modelización predictiva. Dado que los modelos predictivos suelen estar pensados para predecir valores de observaciones previamente desconocidas, me parece obvio que la única forma en que un modelo mixto puede ser útil es a través de su capacidad para proporcionar predicciones a nivel de población (es decir, sin añadir ningún efecto aleatorio). Sin embargo, el problema es que hasta ahora, según mi experiencia, las predicciones a nivel de población basadas en modelos mixtos son significativamente peores que las predicciones basadas en modelos de regresión estándar con efectos fijos únicamente.
Entonces, ¿qué sentido tienen los modelos mixtos en relación con los problemas de predicción?
EDITAR. El problema es el siguiente: He ajustado un modelo mixto (con efectos fijos y aleatorios) y un modelo lineal estándar con efectos fijos solamente. Cuando hago una validación cruzada, obtengo la siguiente jerarquía de precisión predictiva: 1) modelos mixtos cuando se predice utilizando efectos fijos y aleatorios (pero esto funciona, por supuesto, sólo para las observaciones con niveles conocidos de las variables de efectos aleatorios, por lo que este enfoque predictivo parece no ser adecuado para las aplicaciones predictivas reales); 2) modelo lineal estándar; 3) modelo mixto cuando se utilizan predicciones a nivel de población (por lo que se descartan los efectos aleatorios). Así pues, la única diferencia entre el modelo lineal estándar y el modelo mixto es el valor algo diferente de los coeficientes debido a los diferentes métodos de estimación (es decir, hay los mismos efectos/predictores en ambos modelos, pero tienen diferentes coeficientes asociados).
Así que mi confusión se reduce a una pregunta, ¿por qué iba a utilizar un modelo mixto como modelo de predicción, ya que el uso del modelo mixto para generar predicciones a nivel de población parece ser una estrategia inferior en comparación con un modelo lineal estándar.