1 votos

Selección de datos de entrenamiento (la pregunta NO se refiere a la división entrenamiento/validación/prueba ni a los algoritmos ml).

Esto es más una pregunta general y no ml-algoritmo específico, ¿existen algoritmos / herramientas / documentos sobre el tema de la "selección" de datos de entrenamiento-entradas?

A menudo le faltarán datos de entrenamiento, por lo que es aconsejable utilizarlos todos o incluso intentar encontrar más datos.

Parece que muchas personas se centran y desarrollan muchos métodos sobre la selección/importancia de las características y el ajuste del algoritmo, pero en lo que respecta a los datos de formación el enfoque principal es reunir más.

PD: google/literatura tiene mucha información sobre qué ml-algo usar para qué datos o cómo dividir datos de entrenamiento/prueba, pero esto no es lo que necesito. Clases desequilibradas se acerca más a mi pregunta, pero todavía no es exactamente lo que trato de encontrar.

2voto

ramiwi Puntos 8

Existen algunos trabajos relacionados con la selección de datos de otros dominios para mejorar el rendimiento del modelo:

Aprender a seleccionar datos para el aprendizaje por transferencia con optimización bayesiana https://arxiv.org/abs/1707.05246

Ponderación de instancias para la adaptación de dominios en PNL http://sifaka.cs.uiuc.edu/czhai/pub/acl07.pdf

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X