12 votos

Aprendizaje automático moderno y el intercambio entre sesgo y varianza

Me topé con el siguiente documento Reconciliando la práctica moderna de aprendizaje automático y el trade-off sesgo-varianza y no comprendo completamente cómo justifican la curva de riesgo de doble descenso (ver abajo), descrita en su documento.

enter image description here

En la introducción dicen:

Al considerar clases de funciones más grandes, que contienen más candidatos a predictores compatibles con los datos, podemos encontrar funciones interpolantes que tienen una norma más pequeña y por lo tanto son "más simples". Así que aumentar la capacidad de la clase de funciones mejora el rendimiento de los clasificadores.

A partir de esto puedo entender por qué el riesgo de prueba disminuye en función de la capacidad de la clase de funciones.

Lo que no entiendo entonces con esta justificación, sin embargo, es por qué el riesgo de prueba aumenta hasta el punto de interpolación y luego vuelve a disminuir. ¿Y por qué es exactamente en el punto de interpolación que el número de puntos de datos $n$ es igual al parámetro de función $N$?

Sería genial si alguien pudiera ayudarme aquí.

13voto

ssn Puntos 472

El punto principal sobre el Doble Descenso de Belkin es que, en el umbral de interpolación, es decir, la menor capacidad de modelo donde se ajustan los datos de entrenamiento exactamente, el número de soluciones es muy limitado. El modelo tiene que "estirarse" para alcanzar el umbral de interpolación con una capacidad limitada.

Cuando aumentas la capacidad más allá de eso, el espacio de soluciones interpolantes se abre, permitiendo realmente que la optimización alcance soluciones interpolantes de menor norma. Estas tienden a generalizarse mejor, y por eso obtienes el segundo descenso en los datos de prueba.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X