8 votos

¿Procesos Dirichlet para el aprendizaje supervisado?

Parece que cuando echo un vistazo a los algoritmos de aprendizaje de moda, se promueven cosas como las redes neuronales, los árboles potenciados, las máquinas de vectores de apoyo, los bosques aleatorios y amigos para problemas de aprendizaje supervisado. Los procesos de Dirichlet y sus similares parecen mencionarse sobre todo en problemas de aprendizaje no supervisado, como la agrupación de documentos o imágenes. Veo que se utilizan para problemas de regresión, o como prioridades de propósito general cuando se quiere hacer estadística bayesiana de una manera no paramétrica o semiparamétrica (por ejemplo, como una prioridad flexible en la distribución de los efectos aleatorios en ciertos modelos), pero mi limitada experiencia sugiere que esto no viene tanto de la multitud de aprendizaje automático como de los estadísticos más tradicionales. He buscado un poco en Google y he encontrado algunos usos definitivos en el aprendizaje automático de las PP para el aprendizaje supervisado, pero parece que cada vez que necesito buscar algo sobre (digamos) las PP jerárquicas, cualquier artículo en el que encuentro la respuesta lo utiliza para el aprendizaje no supervisado.

Entonces, ¿son los procesos Dirichlet y sus primos los más eficaces como priores para los modelos de agrupación flexible? ¿No son competitivos con el boosting, las SVM y las redes neuronales para los problemas de aprendizaje supervisado? ¿Son útiles sólo en determinadas situaciones para estos problemas? ¿O mi impresión general es incorrecta?

1voto

Andre Miller Puntos 182

Esta pregunta no está recibiendo demasiada atención, así que voy a responder para actualizar lo que he encontrado y (espero) estimular la discusión. Me he topado con un artículo que estoy deseando leer que utiliza DPMs para hacer la clasificación (Shahbaba y Neal, 2007) que probaron en datos de pliegues de proteínas. Esencialmente parece que utilizaron hizo algo similar a lo que sugerí en los comentarios anteriores. Se comparó de forma favorable tanto con las redes neuronales como con las máquinas de vectores de apoyo. Esto viene como un poco de alivio para mí, ya que he volcado un montón de tiempo en estos modelos con un ojo hacia los problemas de aprendizaje automático supervisado por lo que parece que (tal vez) no he estado perdiendo mi tiempo.

1voto

Jonathan Arkell Puntos 4265

Eche un vistazo al DPpackage de R. El proceso Dirichlet puede utilizarse al menos como una prioridad para un efecto aleatorio, y para construir una distribución de error no paramétrica para la regresión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X