Aprendizaje supervisado
- 1) Un humano construye un clasificador basado en entrada y salida datos
- 2) Ese clasificador se entrena con un conjunto de datos de entrenamiento
- 3) Ese clasificador se prueba con un conjunto de datos de prueba
- 4) Despliegue si el salida es satisfactorio
Se utiliza cuando: "Sé cómo clasificar estos datos, sólo necesito que tú (el clasificador) los clasifiques".
Punto de método: Clasificar etiquetas o producir números reales
Aprendizaje no supervisado
- 1) Un humano construye un algoritmo basado en entrada datos
- 2) Ese algoritmo se prueba con un conjunto de datos de prueba (en el que el algoritmo crea el clasificador)
- 3) Despliegue si el clasificador es satisfactorio
Se utiliza cuando: "No tengo ni idea de cómo clasificar estos datos, ¿puedes (el algoritmo) crear un clasificador por mí?"
Punto del método: Clasificar etiquetas o predecir (PDF)
Aprendizaje por refuerzo
- 1) Un humano construye un algoritmo basado en entrada datos
- 2) Ese algoritmo presenta una estado depende de la entrada datos en los que un usuario premia o castiga al algoritmo a través de la acción el algoritmo tomó, esto continúa con el tiempo
- 3) Ese algoritmo aprende de la recompensa/castigo y se actualiza, esto continúa
- 4) Siempre está en producción, necesita aprender datos reales para poder presentar acciones de estados
Se utiliza cuando: "No tengo ni idea de cómo clasificar estos datos, ¿puedes clasificar estos datos y te daré una recompensa si es correcto o te castigaré si no lo es?".
Es este el tipo de flujo de estas prácticas, escucho mucho sobre lo que hacen, pero el práctico y ejemplar la información es terriblemente ¡poco!