En mi opinión, es casi imposible tener éxito en optimizar la predicción exacta de inéditos observaciones, y la comprensión del fenómeno. Mejor centrarse adecuadamente.---ljubomir
ljumboir escribió este comentario para explicar una respuesta escribió que compara el Aprendizaje de Máquina para las Estadísticas:
Voy a argumentar que la distinción entre el aprendizaje de máquina y la inferencia estadística es clara. En resumen, el aprendizaje de máquina = predicción de futuras observaciones; estadísticas = explicación.
Ijumboir la respuesta es excelente, y su distinción entre la predicción y la explicación que hace un montón de sentido intuitivo. Pero estoy confundido ¿por qué esa distinción siquiera existe en el primer lugar. ¿Por qué es tan difícil predecir el futuro y explicar el presente? Yo habría pensado que si se puede predecir algo, también puede explicar (y viceversa), pero parece que eso no es cierto en el mundo real...y me pregunto por qué ese es el caso.
Respuestas
¿Demasiados anuncios?No estoy de acuerdo con la caracterización de la distinción entre el aprendizaje de máquina y estadísticas. Tanto la máquina de aprendizaje y estadísticas acerca de la predicción y la explicación y tener herramientas para tanto. Podría decirse que el aprendizaje automático es una rama de la estadística computacional, de manera que la distinción entre los dos no es fácil tampoco.
En cuanto a "¿por Qué es tan difícil predecir el futuro y explicar el presente?", en mi opinión esto es principalmente debido a que somos capaces de entender (relativamente) simple explicaciones (por ejemplo, más bien pequeño, árboles de decisión, modelos lineales), el cual puede no ser lo suficientemente complejo para representar el verdadero comportamiento subyacente del sistema que está siendo modelado. "Todos los modelos están equivocados, pero algunos son útiles" - una manera en la que puede ser útil es por ser bastante simple que nos puede entender, la otra es ser bastante complicadas que dan la exactitud de las predicciones. Caballos de carreras.
Obviamente, hay algunos ejemplos en los que el óptimo modelo explicativo y el mejor modelo predictivo coinciden, por ejemplo, la clasificación de los problemas en los que la teoría sugiere que la clase condicional densidades Gaussianas, un modelo lineal de ser explicativas y la probabilidad de dar una buena predicción de rendimiento (como es el de Bayes modelo óptimo). Sin embargo, en la mayoría de los casos, esto no será el caso, ya que el problema es menos restricciones y supuestos del modelo raro para ser completamente válido. "Todo debe ser tan simple como sea posible, pero no más simple", atribuida a Albert Einstein viene a la mente!
Por CIERTO, cuando la búsqueda de un modelo explicativo, a menudo es una buena idea para adaptarse a un complejo de "aprendizaje automático" caja negra modelo así, si sólo para obtener una indicación de la cantidad que el modelo explicativo no es explicar.
No estoy de acuerdo. Si usted entiende algo, usted también es capaz de predecir el comportamiento. Yo supongo que lo que ljubomir decir es que si usted está interesado en la construcción de un modelo, para describir y comprender algún fenómeno, desea mantener la escasa y simple, porque complicados modelos no ayudará a entender mejor la complicada realidad (véase la navaja de Occam). Por otro lado, si sólo desea hacer predicciones, no importa si su modelo es complicada y no es fácilmente interpretable si sólo se predice correctamente. Sin embargo, esto no significa que los modelos complicados son mejores para hacer predicciones! Complicado modelo puede overfit los datos, mientras que el modelo simple puede ser más robusto y así servir mejor para predicciones a largo plazo. Para dar un ejemplo más, en algunas áreas que se pueden construir modelos precisos de los fenómenos de interés, que puede dar predicciones perfectas (por ejemplo, un modelo mecanicista de algún proceso físico).