20 votos

Aprendizaje semisupervisado, aprendizaje activo y aprendizaje profundo para la clasificación

Edición final con todos los recursos actualizados:

Para un proyecto, estoy aplicando algoritmos de aprendizaje automático para la clasificación.

Desafío: Datos etiquetados bastante limitados y muchos más datos sin etiquetar.

Objetivos:

  1. Aplicar la clasificación semisupervisada
  2. Aplicar de algún modo un proceso de etiquetado semisupervisado (conocido como aprendizaje activo)

He encontrado mucha información en trabajos de investigación, como aplicar EM, SVM Transductiva o S3VM (Semi Supervised SVM), o de alguna manera utilizar LDA, etc. Incluso hay pocos libros sobre este tema.

Pregunta: ¿Dónde están las aplicaciones y las fuentes prácticas?


Actualización final (basada en las ayudas proporcionadas por mpiktas, bayer y Dikran Marsupial)

Aprendizaje semisupervisado:

Aprendizaje activo:

  • Dualista una aplicación de aprendizaje activo con código fuente sobre clasificación de textos
  • Este página web ofrece una magnífica visión general del aprendizaje activo.
  • Un taller de diseño experimental: aquí .

Aprendizaje profundo:

  • Vídeo introductorio en aquí .
  • Sitio general .
  • Aprendizaje no supervisado de características y aprendizaje profundo de Stanford tutorial .

8voto

karatchov Puntos 230

Parece que el aprendizaje profundo puede ser muy interesante para usted. Se trata de un campo muy reciente de modelos conexionistas profundos que se preentrenan de forma no supervisada y se afinan después con supervisión. El ajuste fino requiere muchas menos muestras que el preentrenamiento.

Para mojarse la lengua, le recomiendo [Semantig Hashing Salakhutdinov, Hinton . Eche un vistazo a los códigos que encuentra para distintos documentos del corpus Reuters: (¡sin supervisión!)

enter image description here

Si necesita implementar algún código, consulte aprendizaje profundo.net . Sin embargo, no creo que haya soluciones listas para usar.

5voto

John Richardson Puntos 1197

Isabelle Guyon (y sus colegas) organizaron hace un tiempo un desafío sobre el aprendizaje activo, cuyas actas están publicadas aquí (acceso abierto). Esto tiene la ventaja de ser bastante práctico y se pueden comparar directamente los resultados de diferentes enfoques con un protocolo imparcial (en un sentido coloquial) (la selección aleatoria de patrones es sorprendentemente difícil de superar).

0voto

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X