Processing math: 100%

25 votos

Datos técnicas de aumento general de los conjuntos de datos?

En muchos de aprendizaje automático de las aplicaciones, los llamados datos de aumento métodos han permitido construir mejores modelos. Por ejemplo, supongamos que un entrenamiento conjunto de 100 imágenes de gatos y perros. Por la rotación, reflejo, el ajuste de contraste, etc. es posible generar imágenes a partir de las originales.

En el caso de las imágenes, los datos de aumento es relativamente sencillo. Sin embargo, supongamos que (por ejemplo) que uno tiene un conjunto de entrenamiento de 100 de muestras y unos cientos de variables continuas que representan diferentes cosas. Los datos de aumento de no más parece tan intuitivo. ¿Qué se podría hacer en tal caso?

19voto

Boris Bukh Puntos 131

Entiendo que esta pregunta como que involucran tanto la construcción de la característica y de lidiar con la gran cantidad de características que usted ya tiene + construirá, en relación a sus observaciones (N << P).

Construcción De La Característica

Ampliando @yasin.yazici el comentario de algunas de las posibles maneras de aumentar los datos sería:

  • PCA
  • Auto-codificación
  • Transformar tales como registro, poderes, etc.
  • El agrupamiento de las variables continuas en categorías discretas (es decir, variable continua es de 1 SD por encima de la media, 1 por debajo de la media, etc.)
  • Compuesto de variables (por ejemplo, ver aquí)

Estoy seguro de que hay muchos más que me estoy perdiendo.

Selección de función / reducción de Dimensionalidad

Usted puede reducir la dimensionalidad con técnicas tales como la PCA (aunque, tal vez, no después de aumentar tus datos con PCA variables). Como alternativa, puede utilizar algoritmos que realizan la selección de características, como por ejemplo, lazo, bosque aleatorio, etc.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X