Con todo respeto, esta pregunta podría estar mejor enfocada. ¿Se ha utilizado alguna vez un término cuando el otro era más apropiado? Sí, por supuesto. A veces está suficientemente claro por el contexto, o no se quiere ser pedante. A veces la gente es simplemente descuidada o perezosa en su terminología. Esto ocurre con mucha gente, y yo no soy mejor.
Lo que tiene valor potencial aquí (al discutir la explicación frente a la predicción en la CV), es aclarar la distinción entre los dos enfoques. En resumen, la distinción se centra en el papel de causalidad . Si se quiere comprender alguna dinámica del mundo y explicar por qué algo sucede de la manera en que lo hace, es necesario identificar las relaciones causales entre las variables relevantes. Para predecir, se puede ignorar la causalidad. Por ejemplo, se puede predecir un efecto a partir del conocimiento de su causa; se puede predecir la existencia de la causa a partir del conocimiento de que el efecto se ha producido; y se puede predecir el nivel aproximado de un efecto mediante el conocimiento de otro efecto impulsado por la misma causa. ¿Por qué querría alguien ser capaz de hacer esto? Para aumentar su conocimiento de lo que puede ocurrir en el futuro, de modo que pueda planificar en consecuencia. Por ejemplo, una junta de libertad condicional puede querer ser capaz de predecir la probabilidad de que un convicto reincida si sale en libertad condicional. Sin embargo, esto no es suficiente para la explicación. Por supuesto, estimar la verdadera relación causal entre dos variables puede ser extremadamente difícil. Además, los modelos que sí captan (lo que se cree que son) las verdaderas relaciones causales suelen ser peores para hacer predicciones. Entonces, ¿por qué hacerlo? En primer lugar, la mayoría de las veces se hace en la ciencia, donde se persigue la comprensión por sí misma. En segundo lugar, si podemos identificar de forma fiable las verdaderas causas y desarrollar la capacidad de influir en ellas, podemos ejercer cierta influencia sobre los efectos.
En cuanto a la estrategia de modelización estadística, no hay una gran diferencia. La diferencia radica principalmente en la forma de realizar el estudio. Si su objetivo es poder predecir, averigüe de qué información dispondrán los usuarios del modelo cuando tengan que hacer la predicción. La información a la que no tendrán acceso no tiene ningún valor. Si lo más probable es que quieran ser capaces de predecir en un determinado nivel (o dentro de un rango estrecho) de los predictores, intente centrar el rango muestreado del predictor en ese nivel y sobremuestrear allí. Por ejemplo, si una junta de libertad condicional quiere saber sobre todo de los delincuentes con 2 condenas importantes, podría reunir información sobre los delincuentes con 1, 2 y 3 condenas. Por otro lado, la evaluación del estado causal de una variable requiere básicamente un experimento. Es decir, las unidades experimentales deben ser asignadas al azar a niveles preestablecidos de las variables explicativas. Si existe la preocupación de si la naturaleza del efecto causal depende de alguna otra variable, ésta debe incluirse en el experimento. Si no es posible llevar a cabo un verdadero experimento, entonces nos enfrentamos a una situación mucho más difícil, demasiado compleja para entrar en ella.