Si me equivoco, "la clasificación no supervisada" es igual que el agrupamiento. ¿Entonces hay "regresión sin supervisión"? ¡Gracias!
Respuestas
¿Demasiados anuncios?Nunca he encontrado este término antes. Estoy seguro de que si la propagación de la luz o de la oscuridad dentro de su esfera de las estadísticas: los que siendo de aprendizaje de la máquina (donde supervisadas y no supervisadas distinciones son fundamentales para la resolución de problemas) y la estadística inferencial (donde regresión, análisis de confirmación, y NHSTs son las más frecuentemente empleadas).
Dónde están esas dos filosofías se superponen, la mayoría de regresión y la terminología asociada es arrojada en un sentido estrictamente supervisado. Sin embargo, creo que muchos de los conceptos ya existentes en la supervisión de aprendizaje están estrechamente relacionados con la regresión basada en enfoques, especialmente cuando usted ingenuamente iterar sobre cada clase o función, como un resultado y poner en común los resultados. Un ejemplo de esto es el PCA y bivariado el análisis de correlación. Mediante la aplicación de mejores subconjunto de regresión de forma iterativa a través de una serie de variables, se puede hacer una muy complejo especie de red de estimación, como se supone en los modelos de ecuaciones estructurales (estrictamente en el EPT sentido). Esto, para mí, parece un problema de aprendizaje no supervisado con la regresión.
Sin embargo, la regresión de las estimaciones de los parámetros no son reflexivos. Para la regresión lineal simple, regresión $Y$ $X$ le dará resultados diferentes, diferentes de inferencia, y diferentes estimaciones (ni siquiera inversa necesariamente), de $X$$Y$. En mi opinión, esta falta de conmutatividad hace más ingenuo de regresión de aplicaciones inelegible para problemas de aprendizaje no supervisado.
La cosa más cercana que se me ocurre es un poco de magia negra que se había despertado en la gente cuando se anunció hace un par de años, pero no creo que se ganó la real tracción en la comunidad. Los autores desarrollaron un dato que llama la "Máxima Información Coeficiente (MIC)." La idea general detrás de su método es tomar altamente dimensional de datos, parcela de cada variable en contra de cada una de las otras variables en parejas y, a continuación, aplicar una interesante ventana-algoritmo de agrupamiento para cada parcela (que calcula el MICRÓFONO para esas dos variables) para determinar si existe potencialmente una relación entre las dos variables. La técnica que se supone para ser robusto a la identificación arbitrariamente estructurado de relaciones, no sólo lineal.
La técnica de los objetivos de pares de variables, pero estoy seguro de que podría ampliarse a investigar multivariante de las relaciones. El principal problema sería que tendría que ejecutar la técnica sobre significativamente más combinaciones de las variables de medida que permiten permutaciones de más y más variables. Me imagino que probablemente toma algún tiempo sólo con los pares: el intento de utilizar esta ni remotamente de grandes dimensiones de los datos y considerando la posibilidad de relaciones más complejas que la de los pares de variables sería intratable rápido.
Hacer referencia al papel de la Detección de Asociaciones Novela en Grandes conjuntos de datos (2011)