2 votos

¿Qué es el aprendizaje tolerante al ruido?

Estaba leyendo esto Desarrollo y validación de clasificadores de fenotipos a través de múltiples sitios en la red de ciencias e informática de datos sanitarios observacionales y me encontré con el siguiente párrafo. ¿Podría ayudarme a entender qué significa el término resaltado noise-tolerant learning or ¿se refiere a los datos de entrenamiento con etiquetas ruidosas con un simple ejemplo y cómo es útil cuando no tenemos etiquetas en nuestro conjunto de datos, etc.? Estoy aprendiendo ML y sus aportaciones serían útiles.

Para hacer frente a la escasez de datos de entrenamiento etiquetados, Chen et al utilizaron aprendizaje activo para seleccionar inteligentemente las muestras de entrenamiento para el etiquetado, demostrando que el rendimiento del clasificador puede mantenerse con con menos muestras.16 Otra tendencia es el uso de "conjuntos de entrenamiento estándar de entrenamiento", un enfoque semisupervisado en el que las muestras de entrenamiento se etiquetan utilizando una heurística imperfecta en lugar de una revisión manual.17-22 La intuición de La intuición es que los clasificadores tolerantes al ruido entrenados con datos etiquetados abstraerán propiedades de orden superior del fenotipo más allá de la heurística de etiquetado original (el llamado "aprendizaje ruido "23).

3voto

kjetil b halvorsen Puntos 7012

El documento es bastante claro, el aprendizaje tolerante al ruido, en este caso, se trata de ruido de la etiqueta . En este caso las etiquetas son diagnósticos médicos, en parte decididos automáticamente por algún algoritmo. Estas decisiones pueden ser ruidosas, por lo que las etiquetas también lo serán.

Así que se trata de aprender algoritmos que sean robustos frente al posible ruido de las etiquetas. Para dar un poco de contexto, la primera parte del resumen de ese documento es

Objetivo

La precisión del fenotipo electrónico es esencial para apoyar la colaboración investigación observacional. Los métodos de aprendizaje automático supervisado pueden para entrenar a los clasificadores de fenotipos de una manera de alto rendimiento utilizando datos imperfectamente etiquetados. Desarrollamos 10 clasificadores de fenotipos utilizando de fenotipos con este enfoque y evaluamos el rendimiento en múltiples de la red Observational Health Data Sciences and Informatics (OHDSI) (OHDSI).

Y el documento 23 de las referencias es Límites generales del número de ejemplos necesarios para aprender conceptos probabilísticos que sí contiene teoremas sobre clasificación del ruido (término utilizado en ese documento).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X