Característica de ingeniería, con frecuencia es un componente importante para el aprendizaje de máquina (que fue utilizada en gran medida para ganar la KDD Cup en 2010). Sin embargo, me parece que la mayoría de las característica técnicas de ingeniería, ya sea
- destruir cualquier significado intuitivo de los rasgos subyacentes o
- son muy específicas para un dominio particular o incluso determinados tipos de características.
Un clásico ejemplo de lo primero sería el análisis de componentes principales. Me parece que cualquier conocimiento de que un experto en la materia que tienen sobre las características serían destruidos por la conversión de estas funciones de componentes principales.
En contraste con una técnica sencilla de convertir una fecha en cuenta para el "día del mes" y "día de la semana." El significado subyacente todavía se mantiene en las nuevas características, pero, obviamente, esta técnica sólo se aplica para las fechas y no arbitraria características.
¿Hay alguna norma cuerpo de característica de técnicas de ingeniería que no destruyan el significado de las operaciones subyacentes, mientras que también se aplica a dominios arbitrarios (o al menos una amplia variedad de dominios)?