Conseguí una buena representación gráfica del aprendizaje automático para la agrupación/clasificación.
Fuente: Enfoques de núcleos para el aprendizaje automático supervisado y no supervisado por Sun-Yuan Kung
Aquí están mis pensamientos sobre la diferencia:
Supervisado frente a no supervisado :
Aprendizaje supervisado es la tarea de aprendizaje automático de inferir una función a partir de datos de entrenamiento etiquetados. Los datos de entrenamiento consisten en un conjunto de ejemplos de entrenamiento. En el aprendizaje supervisado, cada ejemplo es un par formado por un objeto de entrada (normalmente un vector) y un valor de salida deseado (también llamado señal de supervisión). Un algoritmo de aprendizaje supervisado analiza los datos de entrenamiento y produce una función inferida, que puede utilizarse para asignar nuevos ejemplos.
En el aprendizaje automático, el problema de aprendizaje no supervisado es la de tratar de encontrar una estructura oculta en datos no etiquetados. Como los ejemplos que se dan al alumno no están etiquetados, no hay ninguna señal de error o recompensa para evaluar una solución potencial.
Ambos métodos pueden clasificarse en Kernels lineales y no lineales.
Los enfoques del aprendizaje no supervisado incluyen: agrupación (por ejemplo, k-means, modelos de mezcla, agrupación jerárquica), modelos ocultos de Markov, separación ciega de señales utilizando técnicas de extracción de características para la reducción de la dimensionalidad (por ejemplo, análisis de componentes principales, análisis de componentes independientes, factorización de matrices no negativas, descomposición del valor singular).
Red neutra Las redes neuronales artificiales (RNA) son modelos computacionales inspirados en el sistema nervioso central de los animales (en particular, el cerebro) que son capaces de aprender de forma automática y reconocer patrones. Las redes neuronales artificiales se presentan generalmente como sistemas de "neuronas" interconectadas que pueden calcular valores a partir de entradas.
Entre los modelos de redes neuronales, el mapa autoorganizado (SOM) y la teoría de la resonancia adaptativa (ART) son los algoritmos de aprendizaje no supervisado más utilizados. El SOM es una organización topográfica en la que las ubicaciones cercanas en el mapa representan entradas con propiedades similares. El modelo ART permite que el número de clusters varíe con el tamaño del problema y permite al usuario controlar el grado de similitud entre los miembros de los mismos clusters mediante una constante definida por el usuario llamada parámetro de vigilancia. Las redes ART también se utilizan para muchas tareas de reconocimiento de patrones, como el reconocimiento automático de objetivos y el procesamiento de señales sísmicas.
Mis preguntas son las siguientes:
-
¿Cuál es la diferencia entre Euclidean-Tree y Kernel-Tree? o Euclidean-K-Means SOM vs Kernel version?
-
¿Diferencia entre SVM y Red Neural o SOM?
-
¿Diferencia entre las matrices de correlación y las matrices de núcleo?