Digamos que tengo un clasificador de regresión logística. En el aprendizaje por lotes normal, tendría un término regularizador para evitar el sobreajuste y mantener mis pesos pequeños. También normalizaría y escalaría mis características.
En un entorno de aprendizaje en línea, recibo un flujo continuo de datos. Hago una actualización por descenso de gradiente con cada ejemplo y luego lo descarto. ¿Debo utilizar el escalado de características y el término de regularización en el aprendizaje en línea? En caso afirmativo, ¿cómo puedo hacerlo? Por ejemplo, no tengo un conjunto de datos de entrenamiento para escalar. Tampoco tengo un conjunto de validación para ajustar mi parámetro de regularización. En caso negativo, ¿por qué no?
En mi aprendizaje en línea, recibo un torrente de ejemplos continuamente. Para cada nuevo ejemplo, hago una predicción. A continuación, en el siguiente paso temporal, obtengo el objetivo real y realizo la actualización por descenso de gradiente.