Digamos que tenemos datos para N clases y entrenamos un clasificador. Luego tenemos un nuevo conjunto de datos para una N+1ª clase. ¿Cómo entreno un clasificador que ahora predice todas las N+1 clases?
El ajuste es en la detección de objetos, aunque no creo que deba ser diferente entre la clasificación de imágenes y la detección de objetos. Además, estoy afinando a partir de un modelo pre-entrenado (por ejemplo, VGG16 entrenado en image-net).
Opción 1: Compilar todos los datos para las N+1 clases y afinar de nuevo a partir del VGG16 original entrenado en image-net.
Opción 2: Recopilar todos los datos de las N+1 clases y afinar a partir del modelo entrenado en N clases.
Opción 3: ¿Existe una forma de afinar sólo con los datos de la clase N+1? Supongo que no, ya que los pesos de la última capa (justo antes de la predicción de la clase) deben reiniciarse.
Las opciones 1 y 2 no son ideales porque no son escalables al aumentar el número de clases.