En una frase
La modelización predictiva trata de "¿qué es probable que ocurra?", mientras que la modelización explicativa trata de "¿qué podemos hacer al respecto?".
En muchas frases
Creo que la principal diferencia es lo que se pretende hacer con el análisis. Yo sugeriría que la explicación es mucho más importante para intervención que la predicción. Si quieres hacer algo para modificar un resultado, lo mejor es que intentes explicar por qué es así. La modelización explicativa, si se hace bien, le dirá cómo intervenir (qué entrada debe ajustarse). Sin embargo, si lo que se quiere es entender cómo será el futuro, sin intención (o capacidad) de intervenir, es más probable que la modelización predictiva sea la más adecuada.
Como ejemplo increíblemente flojo, utilizando "datos sobre el cáncer".
La elaboración de modelos predictivos a partir de "datos sobre el cáncer" sería adecuada (o al menos útil) si se financiaran las salas de cáncer de distintos hospitales. En realidad, no es necesario explicar por qué la gente padece cáncer, sino que sólo se necesita una estimación precisa de la cantidad de servicios que se necesitarán. La modelización explicativa probablemente no ayudaría mucho en este caso. Por ejemplo, saber que el tabaquismo conlleva un mayor riesgo de padecer cáncer no te dice por sí solo si debes dar más fondos a la sala A o a la B.
La modelización explicativa de los "datos del cáncer" sería adecuada si se quisiera disminuir la tasa nacional de cáncer: la modelización predictiva sería bastante obsoleta en este caso. La capacidad de predecir con exactitud las tasas de cáncer difícilmente puede ayudar a decidir cómo reducirlas. Sin embargo, saber que el tabaquismo conlleva un mayor riesgo de cáncer es una información valiosa, ya que si se reducen las tasas de tabaquismo (por ejemplo, haciendo que los cigarrillos sean más caros), esto hace que haya más personas con menos riesgo, lo que (con suerte) conduce a una disminución esperada de las tasas de cáncer.
Si consideramos el problema de esta manera, creo que la modelización explicativa se centraría principalmente en las variables que están bajo el control del usuario, ya sea directa o indirectamente. Puede ser necesario recoger otras variables, pero si no se puede cambiar ninguna de las variables en el análisis, entonces dudo que la modelización explicativa sea útil, excepto quizá para dar el deseo de ganar control o influencia sobre las variables que son importantes. La modelización predictiva, crudamente, sólo busca asociaciones entre variables, controladas o no por el usuario. Sólo necesitas conocer las entradas/características/variables independientes/etc. para hacer una predicción, pero necesitas poder modificar o influir en las entradas/características/variables independientes/etc. para intervenir y cambiar un resultado.