9 votos

Definición de regresión

De La Wikipedia:

En la modelización estadística, regresión el análisis es un proceso estadístico para la estimación de las relaciones entre las variables. Incluye muchas técnicas para el modelado y análisis de varias variables, cuando el se enfocan en la relación entre una variable dependiente y una o más variables independientes (o 'predictores').

No es el mismo para la clasificación? En el final, no es el propósito de la máquina de aprendizaje?

14voto

jldugger Puntos 7490

La regresión es mucho más amplio en su alcance y objetivo de la clasificación o de aprendizaje de la máquina (sin embargo, éste puede ser entendido). Hay, sin embargo, mucho en común.

Las relaciones

Las relaciones se analizaron por regresión puede consistir en

  • Asociación

  • La dependencia

  • La relación de causalidad

Clasificación proporciona información acerca de los dos primeros, pero no se pronuncia acerca de la causalidad. Tanto la regresión y la máquina de aprendizaje se han utilizado, a veces con éxito, a menudo es problemático--para sacar conclusiones acerca de la causalidad.

A los efectos de la Regresión

  1. Para obtener un resumen de datos multivariantes.

  2. Para anular el efecto de una variable que podría confundir la cuestión.

  3. Contribuir a intentos de análisis causal.

  4. Medir el tamaño de un efecto.

  5. Tratar de descubrir un matemático o empírica de la ley.

  6. La predicción.

  7. Exclusión: llegar a $x$ "fuera del camino" cuando queremos estudiar la relación entre las otras dos variables que pueden ser afectadas por $x$.

(Después de Mosteller Y Tukey, Análisis de Datos y de Regresión, Capítulo 12B.)

Clasificación logra casi ninguno de estos propósitos. De manera limitada, podría proporcionar algún tipo de resumen (1) y ayuda con el descubrimiento (5).

La máquina de aprendizaje tiene como objetivo la predicción (6). casi exclusivamente. La mayoría de las técnicas de aprendizaje de máquina, que van desde bosques aleatorios a través de las redes neuronales para vectores de soporte de los modelos, son opacos a la comprensión: que hacer específicamente no pretende resumir los datos (1), eliminar los efectos de las variables de confusión (2 y 7), o que nos ayude a descubrir regularidades que pueden ser incorporados en un empírica de la ley (5).


Este post es una ligera expansión de una presentación introductoria he hecho recientemente para un curso de un semestre en la regresión. Muchos más materiales sobre los objetivos y la práctica de la regresión están disponibles allí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X