En primer lugar, permítanme decir que estoy un poco fuera de mi profundidad aquí, así que si a esta pregunta necesita ser re-enunciado o cerrado como un duplicado, por favor hágamelo saber. Puede ser simplemente que no tengo el vocabulario adecuado para expresar mi pregunta.
Estoy trabajando en una tarea de procesamiento de imágenes en la que me identificar las características de una imagen, y luego clasificarlos con base en sus propiedades, incluyendo la forma, el tamaño, la oscuridad, etc. Estoy bastante experiencia con el procesamiento de la imagen parte de esto, pero creo que podría mejorar los métodos puedo utilizar para la clasificación de las funciones.
Ahora, puedo establecer umbrales para cada uno de los parámetros medidos, y luego clasificar características de acuerdo a algunos simple basado en la lógica en que los umbrales de la función ha cruzado. Por ejemplo (las propiedades reales y las agrupaciones son más complejos, pero estoy tratando de simplificar irrelevante partes de mi proyecto para esta pregunta), digamos que soy la agrupación de funciones en los grupos de "Grande y la Oscuridad", "la Grande y la Luz" y "Pequeño". A continuación, una característica $A$ será en "la Gran y Oscura" iff (tamaño($A$)>sizeThreshold) & (oscuridad($A$)>darknessThreshold).
El objetivo es que la clasificación de acuerdo con la clasificación realizada por un experto a nivel humano, así que puede establecer los umbrales para producir la mejor coincidencia entre los grupos humanos y de equipo en una prueba de conjunto, y entonces la esperanza de que la clasificación funciona bien con los nuevos datos.
Esto ya está funcionando bastante bien, pero veo un determinado modo de fallo que creo que puede ser reparable. Digamos que cuentan $A$ se sabe que pertenecen a la "Gran y Oscuro." El humano es clasificada de esta manera porque, aunque era apenas lo suficientemente grande, era muy, muy oscura, que compone un poco por la falta de "grandeza." Mi algoritmo no podría clasificar esta función correctamente, ya que la clasificación está basada en la rígida lógica binaria, y exige que todos los umbrales para ser cruzados.
Me gustaría mejorar este fracaso por hacer que mi algoritmo que mejor imitan a los humanos proceso guiado, en el que una deficiencia en un parámetro puede ser compensada por la abundancia de otro. Para ello, me gustaría aprovechar cada una de las propiedades básicas de mis características, y convertirlos en una especie de partitura, que sería un predictor del grupo al que pertenece el elemento. He pensado muchas maneras de hacer esto, pero la mayoría son ad hoc de ideas, basado en mi experiencia en cálculo vectorial y la física. Por ejemplo, he considerado la posibilidad de tratar a cada característica como un vector en la N-D espacio de propiedades de características, y el cálculo de la proyección de cada una característica a lo largo de ciertos vectores, cada uno de los que miden el grado en que una característica pertenece en el grupo.
Estoy seguro de que hay un más riguroso y mejor técnica establecida para hacer este tipo de cosas, pero mi historia es relativamente débil en el análisis estadístico, así que estoy buscando un empujón en la dirección correcta. Incluso el nombre de una técnica, o un enlace a un libro de texto puede ser de ayuda.
TL;DR: ¿Qué técnicas son útiles en la clasificación de los objetos de la base de un gran número de parámetros descriptivos?