2 votos

cálculo del error de generalización

Estaba siguiendo el curso de Machine Learning de la Universidad de Washington en Coursera, y hubo un punto que captó mi atención. El material era sobre el error de Generalización y el ejemplo era el clásico de estimar el precio de una casa dados los pies cuadrados como característica. En una parte el profesor dice

a diferencia del error de entrenamiento, no podemos calcular la generalización de generalización. Porque todo era relativo a esta verdadera distribución, la verdadera forma en que el mundo funciona

Es decir, ¿es realmente posible no calcular el error de generalización? Me pregunto si esto tiene que ver con el trade off de sesgo y varianza, pero ¿es realmente no computable este error? ¿por qué no podemos amenazarlo como un problema de optimización? Gracias por su ayuda de antemano.

4voto

Bill Puntos 16

Se puede estimar apartando un conjunto de datos de prueba completamente independiente (lo que es difícil de conseguir en la práctica) y utilizarlo sólo una vez, concretamente para estimar el error de generalización del modelo final.

En el momento en que se utiliza la información del conjunto de datos de prueba para seguir optimizando el modelo, la información se ha filtrado y el conjunto de datos de prueba ya no es independiente. En ese caso, su estimación del error de generalización estaría sesgada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X