Una vez creado el vocabulario, tiene una lista de todas las palabras posibles en el conjunto de entrenamiento (diccionario). Hagamos un ejemplo fácil. El conjunto de entrenamiento contiene un "ojo", una "boca" y una "nariz". Cuando llega una nueva imagen de prueba, se extraen las características y se intenta detectar estas tres características. Entonces, lo que haces es crear un histograma, teniendo como índice estos tres. 1. e ye 2. m de la mano. 3. n ose. Por cada rasgo que sea similar a un ojo, vas a añadir un +1. Digamos que ahora usted prueba con una imagen donde hay 100 ojos. Entonces su histograma para esa imagen va a ser [100 0 0] (sin boca y sin nariz.) Por lo tanto, en este caso, esta imagen se representa con 3 componentes.
100 | 0 | 0
e | m | n
Espero que ahora esté más claro. Una imagen, tendrá una especie de "firma" que será una especie de resumen de sus características. En este caso, el histograma definiría perfectamente la imagen como ¡100 ojos! Y es precisamente lo que sería la imagen, ¿no?
Avísame si algo no está claro.