La regresión es mucho más amplio en su alcance y objetivo de la clasificación o de aprendizaje de la máquina (sin embargo, éste puede ser entendido). Hay, sin embargo, mucho en común.
Las relaciones
Las relaciones se analizaron por regresión puede consistir en
Clasificación proporciona información acerca de los dos primeros, pero no se pronuncia acerca de la causalidad. Tanto la regresión y la máquina de aprendizaje se han utilizado, a veces con éxito, a menudo es problemático--para sacar conclusiones acerca de la causalidad.
A los efectos de la Regresión
Para obtener un resumen de datos multivariantes.
Para anular el efecto de una variable que podría confundir la cuestión.
Contribuir a intentos de análisis causal.
Medir el tamaño de un efecto.
Tratar de descubrir un matemático o empírica de la ley.
La predicción.
Exclusión: llegar a $x$ "fuera del camino" cuando queremos estudiar la relación entre las otras dos variables que pueden ser afectadas por $x$.
(Después de Mosteller Y Tukey, Análisis de Datos y de Regresión, Capítulo 12B.)
Clasificación logra casi ninguno de estos propósitos. De manera limitada, podría proporcionar algún tipo de resumen (1) y ayuda con el descubrimiento (5).
La máquina de aprendizaje tiene como objetivo la predicción (6). casi exclusivamente. La mayoría de las técnicas de aprendizaje de máquina, que van desde bosques aleatorios a través de las redes neuronales para vectores de soporte de los modelos, son opacos a la comprensión: que hacer específicamente no pretende resumir los datos (1), eliminar los efectos de las variables de confusión (2 y 7), o que nos ayude a descubrir regularidades que pueden ser incorporados en un empírica de la ley (5).
Este post es una ligera expansión de una presentación introductoria he hecho recientemente para un curso de un semestre en la regresión. Muchos más materiales sobre los objetivos y la práctica de la regresión están disponibles allí.