78 votos

Reflexiones prácticas sobre la modelización explicativa frente a la predictiva

En abril, asistí a una charla en la serie de seminarios del grupo de Estadística del Departamento de Matemáticas de la UMD titulada "¿Explicar o predecir?". La charla fue impartida por Profesora Galit Shmueli que enseña en la Smith Business School de la UMD. Su charla se basó en la investigación que realizó para un trabajo titulado "Modelización predictiva vs. explicativa en la investigación de los SI" y un documento de trabajo de seguimiento titulado "¿Explicar o predecir?" .

El argumento de la Dra. Shmueli es que los términos predictivo y explicativo en un contexto de modelización estadística se han confundido, y que la literatura estadística carece de una discusión exhaustiva de las diferencias. En el artículo, contrasta ambos términos y habla de sus implicaciones prácticas. Te animo a que leas los artículos.

Las preguntas que me gustaría plantear a la comunidad de profesionales son:

  • ¿Cómo se define un ejercicio predictivo frente a uno explicativo/descriptivo? descriptivo? Sería útil que hablara de la aplicación específica aplicación.
  • ¿Ha caído alguna vez en la trampa de usar uno cuando quería usar el otro? Yo sí. ¿Cómo saber cuál usar?

9voto

Paul Raftery Puntos 628

Modelado estadístico: Dos Culturas (2001) de L. Breiman es, quizás, el mejor trabajo sobre este punto. Sus principales conclusiones (véanse también las respuestas de otros destacados estadísticos al final del documento) son las siguientes:

  • "Una mayor precisión predictiva está asociada a información más fiable sobre los datos subyacentes mecanismo. Una precisión predictiva débil puede llevar a conclusiones cuestionables".
  • "Los modelos algorítmicos pueden dar una mayor precisión predictiva precisión que los modelos de datos, y proporcionan mejor información sobre el mecanismo subyacente".

8voto

NotMyself Puntos 7567

No he leído su trabajo más allá del resumen del artículo enlazado, pero mi sensación es que la distinción entre "explicación" y "predicción" debería desecharse y sustituirse por la distinción entre los objetivos del profesional, que son "causales" o "predictivos". En general, creo que "explicación" es una palabra tan vaga que no significa casi nada. Por ejemplo, ¿la Ley de Hooke es explicativa o predictiva? En el otro extremo del espectro, ¿son los sistemas de recomendación predictivos buenos modelos causales de las valoraciones explícitas de los artículos? Creo que todos compartimos la intuición de que el objetivo de la ciencia es la explicación, mientras que el objetivo de la tecnología es la predicción; y esta intuición se pierde de algún modo al considerar las herramientas que utilizamos, como los algoritmos de aprendizaje supervisado, que pueden emplearse tanto para la inferencia causal como para el modelado predictivo, pero que en realidad son dispositivos puramente matemáticos que no están intrínsecamente vinculados a la "predicción" o la "explicación".

Dicho todo esto, quizá la única palabra que aplicaría a un modelo es interpretable. Las regresiones suelen ser interpretables; las redes neuronales con muchas capas no suelen serlo. Creo que la gente a veces asume ingenuamente que un modelo que es interpretable está proporcionando información causal, mientras que los modelos no interpretables sólo proporcionan información predictiva. Esta actitud me parece simplemente confusa.

7voto

Todavía no tengo claro cuál es la pregunta. Dicho esto, en mi opinión la diferencia fundamental entre los modelos predictivos y los explicativos es la diferencia en su enfoque.

Modelos explicativos

Por definición, los modelos explicativos tienen como objetivo principal explicar algo en el mundo real. En la mayoría de los casos, buscamos ofrecer explicaciones simples y limpias. Por simple quiero decir que preferimos la parsimonia (explicar el fenómeno con el menor número de parámetros posible) y por limpio quiero decir que nos gustaría hacer afirmaciones de la siguiente forma "el efecto de cambiar $x$ por una unidad cambia $y$ por $\beta$ manteniendo todo lo demás constante". Teniendo en cuenta estos objetivos de explicaciones sencillas y claras, los modelos explicativos tratan de penalizar los modelos complejos (mediante el uso de criterios apropiados como el AIC) y prefieren obtener variables independientes ortogonales (ya sea mediante experimentos controlados o mediante transformaciones adecuadas de los datos).

Modelos predictivos

El objetivo de los modelos predictivos es predecir algo. Por lo tanto, tienden a centrarse menos en la parsimonia o la simplicidad y más en su capacidad para predecir la variable dependiente.

Sin embargo, lo anterior es una distinción un tanto artificial, ya que los modelos explicativos pueden utilizarse para predecir y, a veces, los modelos predictivos pueden explicar algo.

5voto

Jon Galloway Puntos 28243

Como ya han dicho otros, la distinción carece en cierto modo de sentido, salvo en lo que respecta a los objetivos del investigador.

Brad Efron, uno de los comentaristas de Las dos culturas hizo la siguiente observación (como se discute en mi pregunta anterior ):

La predicción por sí misma es sólo en ocasiones es suficiente. El correo de correos está contento con cualquier método que predice las direcciones correctas a partir de de los garabatos escritos a mano. Peter Gregory emprendió su estudio para predicción, pero también para comprender mejor las bases médicas de la la hepatitis. La mayoría de los estudios estadísticos tienen como objetivo final la identificación de de los factores causales.

Algunos campos (por ejemplo, la medicina) dan mucha importancia al ajuste del modelo como proceso explicativo (la distribución, etc.), como medio para comprender el proceso subyacente que genera los datos. Otros campos se preocupan menos por esto, y se contentan con un modelo de "caja negra" que tenga un éxito predictivo muy alto. Esto también puede influir en el proceso de creación de modelos.

5voto

Sean Hanley Puntos 2428

Con todo respeto, esta pregunta podría estar mejor enfocada. ¿Se ha utilizado alguna vez un término cuando el otro era más apropiado? Sí, por supuesto. A veces está suficientemente claro por el contexto, o no se quiere ser pedante. A veces la gente es simplemente descuidada o perezosa en su terminología. Esto ocurre con mucha gente, y yo no soy mejor.

Lo que tiene valor potencial aquí (al discutir la explicación frente a la predicción en la CV), es aclarar la distinción entre los dos enfoques. En resumen, la distinción se centra en el papel de causalidad . Si se quiere comprender alguna dinámica del mundo y explicar por qué algo sucede de la manera en que lo hace, es necesario identificar las relaciones causales entre las variables relevantes. Para predecir, se puede ignorar la causalidad. Por ejemplo, se puede predecir un efecto a partir del conocimiento de su causa; se puede predecir la existencia de la causa a partir del conocimiento de que el efecto se ha producido; y se puede predecir el nivel aproximado de un efecto mediante el conocimiento de otro efecto impulsado por la misma causa. ¿Por qué querría alguien ser capaz de hacer esto? Para aumentar su conocimiento de lo que puede ocurrir en el futuro, de modo que pueda planificar en consecuencia. Por ejemplo, una junta de libertad condicional puede querer ser capaz de predecir la probabilidad de que un convicto reincida si sale en libertad condicional. Sin embargo, esto no es suficiente para la explicación. Por supuesto, estimar la verdadera relación causal entre dos variables puede ser extremadamente difícil. Además, los modelos que sí captan (lo que se cree que son) las verdaderas relaciones causales suelen ser peores para hacer predicciones. Entonces, ¿por qué hacerlo? En primer lugar, la mayoría de las veces se hace en la ciencia, donde se persigue la comprensión por sí misma. En segundo lugar, si podemos identificar de forma fiable las verdaderas causas y desarrollar la capacidad de influir en ellas, podemos ejercer cierta influencia sobre los efectos.

En cuanto a la estrategia de modelización estadística, no hay una gran diferencia. La diferencia radica principalmente en la forma de realizar el estudio. Si su objetivo es poder predecir, averigüe de qué información dispondrán los usuarios del modelo cuando tengan que hacer la predicción. La información a la que no tendrán acceso no tiene ningún valor. Si lo más probable es que quieran ser capaces de predecir en un determinado nivel (o dentro de un rango estrecho) de los predictores, intente centrar el rango muestreado del predictor en ese nivel y sobremuestrear allí. Por ejemplo, si una junta de libertad condicional quiere saber sobre todo de los delincuentes con 2 condenas importantes, podría reunir información sobre los delincuentes con 1, 2 y 3 condenas. Por otro lado, la evaluación del estado causal de una variable requiere básicamente un experimento. Es decir, las unidades experimentales deben ser asignadas al azar a niveles preestablecidos de las variables explicativas. Si existe la preocupación de si la naturaleza del efecto causal depende de alguna otra variable, ésta debe incluirse en el experimento. Si no es posible llevar a cabo un verdadero experimento, entonces nos enfrentamos a una situación mucho más difícil, demasiado compleja para entrar en ella.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X