15 votos

¿Modelos predictivos: estadísticas pueden ' t posiblemente vencer el aprender de máquina?

Actualmente estoy siguiendo un programa de máster centrado en estadísticas/la econometría. En mi maestro, todos los estudiantes tenían que hacer 3 meses de investigación. La semana pasada, todos los grupos tenían que presentar sus trabajos de investigación para el resto de los estudiantes de máster.

Casi cada grupo hizo algunos de modelización estadística y algunos de la máquina de aprendizaje de la modelización para sus temas de investigación y cada vez fuera de la muestra predicciones llegó a hablar de la simple máquina de aprendizaje de los modelos de vencer a los muy sofisticados modelos estadísticos que cada trabajado muy duro durante los últimos 3 meses. No importa lo bueno que el de todos los modelos estadísticos para obtener, un simple bosque aleatorio tengo más bajos de los errores de muestreo casi siempre.

Me preguntaba si este es generalmente aceptada la observación? Que si se trata de un ejemplo de previsión simplemente no hay manera de vencer a un simple bosque aleatorio o extrema gradiente de impulsar el modelo? Estos dos métodos son super sencillos de implementar mediante el uso de paquetes de R, mientras que todos los modelos estadísticos que todo el mundo se acercó con requieren una gran cantidad de habilidades, conocimientos y esfuerzos para la estimación.

¿Qué piensa usted de esto? Es el único beneficio de estadística/los modelos econométricos que el aumento de la interpretación? O fueron nuestros modelos simplemente no lo suficientemente buenos, que no pudo mejorar significativamente el rendimiento aleatorio simple bosque predicciones? Existen trabajos que abordan este problema?

22voto

Vitaly Puntos 53

Modelado estadístico es diferente de aprendizaje de máquina. Por ejemplo, una regresión lineal es un modelo estadístico y una máquina modelo de aprendizaje. Así que si usted compara una regresión lineal a un bosque al azar, sólo estás comparando una simple máquina modelo de aprendizaje para un más complicado. Está no es la comparación de un modelo estadístico para una máquina modelo de aprendizaje.

Modelado estadístico proporciona más de la interpretación, que en realidad da un modelo de algún parámetro de población. Depende de un gran marco de la matemática y de la teoría, que permite fórmulas para cosas como la varianza de los coeficientes de variación de las predicciones, y la prueba de hipótesis. El rendimiento potencial de la modelización estadística es mucho mayor que el de la máquina de aprendizaje, porque se puede hacer fuertes declaraciones acerca de los parámetros de la población en lugar de simplemente error de medición en la exclusión, pero es considerablemente más difícil de abordar un problema con un modelo estadístico.

6voto

Aksakal Puntos 11351

Está mal el estado de la cuestión de la manera que usted redactado. Por ejemplo, una parte significativa de aprendizaje de la máquina puede ser llamado aprendizaje estadístico. Así, su comparación es como las manzanas vs tartas de frutas.

Sin embargo, yo me voy con la manera en que se enmarca, y reclamar el siguiente: cuando se trata de la predicción no se puede hacer nada sin un poco de forma de las estadísticas, ya que la predicción intrínsecamente tiene la aleatoriedad (la incertidumbre). Considere esto: a pesar del enorme éxito de la máquina de aprendizaje en algunas aplicaciones tiene absolutamente nada para mostrar en los precios de los activos de la predicción. Nada en absoluto. Por qué? Porque en la mayoría de los desarrollados líquido de los mercados de los precios de los activos son inherentemente estocástica.

Puede ejecutar la máquina de aprendizaje durante todo el día para observar y aprender acerca de la desintegración radiactiva de los átomos, y nunca será capaz de predecir el siguiente átomo del tiempo de decaimiento, simplemente porque es aleatorio.

Como un aspirante a estadista que sería tonto de su lado para no dominar la máquina de aprendizaje, porque es una de las mejores aplicaciones de estadísticas, a menos que, por supuesto, usted sabe con seguridad que va a la academia. Cualquier persona que pueda ir a trabajar en las necesidades de la industria para dominar ML. No hay ninguna animosidad o la competencia entre las estadísticas y ML multitudes en todo. De hecho, si te gusta la programación, se sentirá como en casa en ML campo

2voto

Jay Querido Puntos 589

Generalmente no, pero posiblemente sí en virtud de misspecification. El tema que buscas se llama la admisibilidad. Una decisión es admisible si no es menos arriesgada forma de calcularlo.

Todos Bayesiano soluciones son admisibles y no Bayesiano soluciones son admisibles en la medida en que coincidan con un Bayesiano de solución en cada una de las muestras o en el límite. La admisibilidad de una Frecuentista o Bayesiano solución siempre va a vencer a un ML de solución, a menos que también es admisible. Con eso dicho, hay algunos comentarios que hacer una afirmación verdadera, pero vacuo.

En primer lugar, la previa para el Bayesiano opción tiene que ser su verdadero antes y no antes de la distribución utilizada para hacer un editor de un diario feliz. En segundo lugar, muchos Frecuentista soluciones son inadmisibles y una contracción estimador debe haber sido utilizado en lugar de la solución estándar. Una gran cantidad de personas no son conscientes de Stein lema y sus implicaciones para la salida de error de muestreo. Finalmente, ML puede ser un poco más robusto, en muchos casos, a misspecification de error.

Cuando usted se mueve en árboles de decisión y sus primos los bosques, usted no está utilizando una metodología similar, a menos que usted también está usando algo similar a una red de Bayes. Un gráfico de la solución que contiene una cantidad sustancial de la información implícita en ella, particularmente en forma de grafo dirigido. En el momento de añadir información a un probabilístico o estadístico de proceso de reducir la variabilidad de los resultados y cambiar lo que se considera admisible.

Si usted mira en la máquina de aprendizaje a partir de una composición de funciones perspectiva, se convierte en solo un estadístico de la solución, pero el uso de aproximaciones para hacer la solución manejable. Para Bayesiano soluciones, MCMC ahorra cantidades increíbles de tiempo como lo hace gradiente de la pendiente para muchos ML problemas. Si bien se tuvo que construir una exacta posterior a integrar o uso de la fuerza bruta en muchos ML problemas, el sistema solar habría muerto su calor de muerte antes de que usted tiene una respuesta.

Mi conjetura es que usted tiene un mal especificada modelo para el uso de las estadísticas, o inadecuado de las estadísticas. He impartido una ponencia donde he demostrado recién nacidos va a flotar en windows si no esta debidamente envuelto y donde un método Bayesiano tan radicalmente superó a un Frecuentista método de elección multinomial que el método Frecuencial rompió incluso, a la expectativa, mientras que el método Bayesiano duplicado de los participantes de dinero. Ahora he abusado de las estadísticas en la antigua y tomó ventaja de la inadmisibilidad de la Frecuentista estimador en el último, pero los usuarios de las estadísticas podría fácilmente hacer lo que yo hice. Acabo de hacer los extremos para hacer los ejemplos obvios, pero absolutamente real de datos.

Bosques aleatorios son estimadores consistentes y parece que se asemejan a ciertos Bayesiano procesos. Debido a la vinculación con el núcleo de los peritos, que puede estar muy cerca. Si usted ve una diferencia material entre el rendimiento de los tipos de soluciones, entonces hay algo en el problema de fondo que son la incomprensión y si el problema tiene ninguna importancia, entonces usted realmente necesita para buscar la fuente de la diferencia como también puede ser el caso de que todos los modelos están mal especificada.

1voto

Shubhankar Das Puntos 6

Una gran cantidad de aprendizaje de máquina podría no ser muy diferente de p-hacking, al menos para algunos propósitos.

Si usted probar cada posible modelo para encontrar la que tiene la más alta precisión de la predicción (predicción histórica o grupo de predicción) sobre la base de los datos históricos, esto no significa necesariamente que los resultados ayudarán a entender lo que está pasando. Sin embargo, posiblemente se va a encontrar posibles relaciones que puedan informar de una hipótesis.

Motivar a las hipótesis específicas y, a continuación, ponerlos a prueba mediante métodos estadísticos, ciertamente, puede ser del mismo modo p-hackeado (o similar).

Pero el punto es que si el criterio es "el más alto nivel de exactitud de la predicción basada en datos históricos", entonces hay un alto riesgo de ser presumido en algún modelo que uno no entiende, sin tener ninguna idea de lo que impulsó a los resultados históricos y/o si pueden ser de carácter informativo para el futuro.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X