40 votos

Debe parsimonia realmente siendo el estándar de oro?

Sólo un pensamiento:

Parsimonioso modelos siempre han sido el defecto de ir a la selección del modelo, pero, ¿hasta qué grado es este enfoque anticuado? Tengo curiosidad acerca de lo mucho que nuestra tendencia hacia la parsimonia es una reliquia de una época de abaci y las reglas de cálculo (o, más en serio, no las computadoras modernas). Hoy en día la potencia de cálculo nos permite construir modelos cada vez más complejos cada vez con mayor capacidad de predicción. Como resultado de este aumento en el techo y en la potencia de computación, que es lo que realmente necesitan todavía gravitan hacia la sencillez?

Seguro, los modelos más sencillos son más fáciles de entender y de interpretar, pero en la época de creciente de conjuntos de datos con un mayor número de variables y un cambio hacia un mayor enfoque en la predicción de la capacidad, esto puede no ser factible o necesario.

Los pensamientos?

33voto

Nick Thieme Puntos 931

@Matt respuesta original hace un gran trabajo de describir uno de los beneficios de la parsimonia, pero no creo que en realidad responde a su pregunta. En realidad, la parsimonia no es el estándar de oro. No ahora, ni ha sido jamás. Un "estándar de oro" relacionados con la parsimonia es la generalización de error. Nos gustaría desarrollar modelos que no overfit. Que son tan útiles para la predicción (o como interpretables o con el mínimo de error) de la muestra como son en la muestra. Resulta que (porque de las cosas mencionadas anteriormente) que la parsimonia es en realidad un buen proxy para la generalización de error, pero no es el único.

Realmente, pensar acerca de por qué usamos la validación cruzada o bootstrapping o tren/conjuntos de la prueba. El objetivo es crear modelos con buena precisión de generalización. Una gran parte del tiempo, estas formas de estimación de rendimiento de ejemplo hacer a elegir los modelos con menor complejidad, pero no siempre. Como un ejemplo extremo de imaginar que el oráculo nos da la verdadera, pero extremadamente complejo modelo y un pobre, pero modelo parsimonioso. Si parsimonia fue realmente nuestro objetivo, a continuación, elegimos el segundo, pero en realidad, la primera es lo que nos gustaría saber si podríamos. Por desgracia, una gran cantidad de tiempo que la última frase es el trampolín, "si podemos".

26voto

Matt Puntos 588

Parsimonioso modelos son deseables no sólo debido a los requisitos informáticos, sino también para la generalización de rendimiento. Es imposible lograr el ideal de infinito de datos que en forma precisa y completa cubre el espacio muestral, lo que significa que no parsimoniosa de los modelos tienen el potencial de overfit y el modelo de ruido o de la idiosincrasia de la población de la muestra.

Ciertamente es posible construir un modelo con millones de variables, pero sería la utilización de variables que no tienen ningún impacto en los resultados del modelo del sistema. Usted podría conseguir un gran predictivo del rendimiento en el conjunto de datos de entrenamiento, pero los irrelevante variables más que probable disminución de su rendimiento en una invisible de la prueba de conjunto.

Si una variable de salida es realmente el resultado de un millón de variables de entrada, entonces usted haría bien para poner a todos en su modelo de predicción, pero sólo si usted tiene la cantidad suficiente de datos. Con precisión construir un modelo de este tamaño, tendría varios millones de puntos de datos, como mínimo. Parsimonioso modelos están muy bien porque en muchos sistemas del mundo real, un conjunto de datos de este tamaño simplemente no está disponible, y además, la salida es determinado en gran medida por un número relativamente pequeño de variables.

20voto

eldering Puntos 3814

Creo que las respuestas anteriores, hacer un buen trabajo de hacer puntos importantes:

  • Parsimonioso modelos tienden a tener una mejor generalización de características.
  • La parsimonia no es realmente un estándar de oro, pero sólo una consideración.

Quiero añadir un par de comentarios que salen de mi día a día de la experiencia del trabajo.

La generalización de la precisión predictiva argumento es, por supuesto, fuerte, pero es académicamente sesgo en su enfoque. En general, cuando la producción de un modelo estadístico, las economías no son tales que el rendimiento predictivo es completamente dominante consideración. Muy a menudo no están fuera de los grandes limitaciones en lo que es un modelo útil para una aplicación determinada:

  • El modelo debe ser implementados dentro de un marco o el sistema.
  • El modelo debe ser comprensible por una persona no técnica de la entidad.
  • El modelo debe ser eficiente computacionalmente.
  • El modelo debe ser documentable.
  • El modelo debe pasar restricciones regulatorias.

En la aplicación real de los dominios, muchas, si no todas estas consideraciones vienen antes, no después, de predicción de rendimiento y la optimización de la forma modelo y de los parámetros es limitado por esos deseos. Cada una de estas restricciones los sesgos del científico hacia la parsimonia.

Puede ser cierto que en muchos dominios de estas limitaciones están siendo poco a poco levantado. Pero es la suerte de científico, de hecho, que llega a ignorar ellos se centran meramente en la minimización de la generalización de error.

Esto puede ser muy frustrante por primera vez el científico, recién salido de la escuela (que sin duda fue para mí, y continúa cuando siento que las restricciones colocadas en mi trabajo no justificada). Pero en el final, trabajando duro para producir un inaceptable producto es un desperdicio, y que se siente peor que el aguijón de su científicas orgullo.

14voto

JoanComasFdz Puntos 131

Creo que esta es una muy buena pregunta. En mi opinión parsimonia está sobrevalorado. La naturaleza es rara vez de manera parsimoniosa, y así que no debe necesariamente esperar precisa predictivo o descriptivo de los modelos a ser así. Respecto a la cuestión de la interpretación, si usted elige un modelo más simple que sólo modestamente se ajusta a la realidad, simplemente porque usted puede entender, ¿qué son exactamente una comprensión? Suponiendo que los modelos más complejos tenido mejor poder predictivo, parece estar más cerca de los hechos reales de todos modos.

3voto

mwjackson Puntos 1677

Tal vez una revisión de la Ataike los Criterios de Información, un concepto que lo único que he descubierto por casualidad ayer, que busca identificar cuál es el modelo y cómo muchos de los parámetros son la mejor explicación de las observaciones, en lugar de básica de la Navaja de Occam, o de parsimonia enfoque.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X