Los modelos econométricos suelen tratar de determinar la causalidad en un contexto de series temporales. Por ejemplo, al estudiar el impacto de los cambios en los tipos impositivos sobre el crecimiento económico.
Los datos de panel, una serie temporal de conjuntos de datos de sección transversal, se emplean a menudo para estimar los efectos causales. Los estimadores de diferencia en diferencia se emplean habitualmente para este ejercicio (esencialmente, las variables omitidas se diferencian).
Para responder a su pregunta directa, sí, nos preocuparían las variables omitidas cuando intentamos determinar los vínculos causales. Si estas variables están correlacionadas con nuestra variable de tratamiento, entonces podemos obtener una estimación sesgada del efecto causal.
En el caso de la predicción, no buscamos atribuir vínculos causales y, por tanto, el sesgo de las variables omitidas puede ser menos preocupante. Saber que el número de personas que llevan paraguas es un buen predictor de si lloverá o no por la tarde es lo suficientemente útil para que yo pueda predecir el tiempo, pero no puedo explicarlo.
La diferencia entre explicar y predecir es clave si el factor omitido cambia con el tiempo. Si la gente decide que no quiere exponerse al sol y empieza a llevar paraguas en los días lluviosos y soleados, mi capacidad de previsión se rompe. Sin un factor causal, no puedo prever estos fallos del modelo. Así es como el sesgo de las variables omitidas puede ser importante incluso "sólo" para la previsión.
Dado que el modelo no se rompe, podría ser capaz de generar mejores predicciones utilizando factores no causales además de los causales. Todo lo que pueda conseguir para reducir la varianza de mis predicciones.