4 votos

Análisis estadístico aplicado a métodos provenientes del Aprendizaje Automático.

La mayoría de la reciente famoso métodos que sale de la máquina de aprendizaje, están bajo la supervisión de los métodos de aprendizaje como los Árboles de Decisión, Bosques Aleatorios, Aprendizaje Profundo, SVMs.

El más tradicional de aprendizaje supervisado métodos, como la regresión lineal y logística, con o sin regularización, han tenido una larga historia en el análisis de sus matices (por ejemplo, los supuestos para un uso fiable como la normalidad, los intervalos de confianza, pruebas de hipótesis, estimadores óptimos).

A pesar de la tradicional estadísticas de modelos y la más moderna ML vienen de diferentes disciplinas (para las estadísticas teóricamente asociados con los departamentos de matemáticas y, prácticamente, la agronomía, la medicina, las ciencias sociales y de la econometría, y para la máquina de aprendizaje de ciencias de la computación con aplicaciones en la visión, la PNL, y AI), tienen el mismo fin.

Parece que el ML modelos, como muy exitoso como parecen, también parecen tener muy poco apoyo teórico.

En contraste, la regresión lineal puede tener un valor de p del análisis de cada variable, F-test para todo el ajuste, tiene (el clásico de cinco supuestos). Nunca he visto el análisis de los más complicados ML de pruebas.

No parece ser un tratamiento de los modelos de aprendizaje automático con el rigor de los análisis de los modelos estadísticos. http://www.fharrell.com/post/stat-ml/

Es allí cualquier intento de aplicar el clásico de técnicas de análisis estadístico para la evaluación de las nuevas ML modelos de regresión?

6voto

user777 Puntos 10934

Supongo que la principal parte de la respuesta depende de lo que, precisamente, significa "clásicos de análisis estadístico", pero si lo interpretamos ampliamente para significar la aplicación de los teoremas y resultados de la probabilidad y de la estadística, entonces podemos llegar con una buena bibliografía.

Tres referencias de la parte superior de mi cabeza:


A un lado: Es la pena destacar que la diferencia entre el aprendizaje de máquina y de la estadística tiene que ver más con el marketing, más que de cualquier subyacente principios matemáticos.

Por ejemplo, bosques aleatorios fueron propuestas por primera vez por Leo Breiman, que fue una de las estadísticas de profesor en la Universidad de California, Berkeley.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X