12 votos

Dominio independiente de la función de ingeniería que conserva el significado semántico?

Característica de ingeniería, con frecuencia es un componente importante para el aprendizaje de máquina (que fue utilizada en gran medida para ganar la KDD Cup en 2010). Sin embargo, me parece que la mayoría de las característica técnicas de ingeniería, ya sea

  • destruir cualquier significado intuitivo de los rasgos subyacentes o
  • son muy específicas para un dominio particular o incluso determinados tipos de características.

Un clásico ejemplo de lo primero sería el análisis de componentes principales. Me parece que cualquier conocimiento de que un experto en la materia que tienen sobre las características serían destruidos por la conversión de estas funciones de componentes principales.

En contraste con una técnica sencilla de convertir una fecha en cuenta para el "día del mes" y "día de la semana." El significado subyacente todavía se mantiene en las nuevas características, pero, obviamente, esta técnica sólo se aplica para las fechas y no arbitraria características.

¿Hay alguna norma cuerpo de característica de técnicas de ingeniería que no destruyan el significado de las operaciones subyacentes, mientras que también se aplica a dominios arbitrarios (o al menos una amplia variedad de dominios)?

7voto

halr9000 Puntos 3012

Soy consciente de un método de descomposición (pero tal vez hay más...) que puede ser útil en una situación como la que usted describe. Es como 2D-PCA - un alto orden de la descomposición método donde la descomposición (he.e los factores) tienen algún significado. Puedes ver ejemplos y leer sobre ella aquí y aquí y tratar de aquí

5voto

J Healy Puntos 1336

Los últimos profundo de los métodos de aprendizaje el uso Restringido de la Máquina de Boltzmann han demostrado buenas características de varios tipos de datos (audio, imágenes, texto).

Dado que estos métodos de crear un modelo generativo, que a menudo puede generar muy agradable muestras de la modelo.

Echa un vistazo Hinton publicaciones. http://www.cs.toronto.edu/~hinton/

Estos métodos no son totalmente general (ejecutar el mismo código en cada uno de los datos), pero el modelo subyacente es en general similar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X