25 votos

Comparación de dos histogramas mediante la distancia Chi-cuadrado

Quiero comparar dos imágenes de caras. He calculado sus histogramas LBP. Así que ahora tengo que comparar estos dos histogramas y obtener algo que le dirá cuánto estos histogramas son iguales (0 - 100%).

Hay muchas formas de resolver esta tarea, pero los autores del método LBP hacen hincapié (Face Description with Local Binary Patterns: Application to Face Recognition. 2004) que la distancia Chi-cuadrado funciona mejor que la intersección del histograma y el estadístico Log-likelihood.

Los autores también muestran una fórmula de la distancia Chi-cuadrado:

i=1n(xiyi)2(xi+yi)

Dónde n es un número de bins, xi es un valor de la primera bandeja, yi es un valor de la segunda bandeja.

En algunas investigaciones (por ejemplo La familia de distancias del histograma Chi-cuadrado) vi que la fórmula de la distancia Chi-cuadrado es:

12i=1n(xiyi)2(xi+yi)

Y allí http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm Veo que la fórmula de la distancia Chi-cuadrado es:

i=1n(xiyi)2yi

Me quedé con él. Tengo varias preguntas:

  1. ¿Qué expresión debo utilizar?
  2. ¿Cómo debo interpretar un resultado de diferencia? Sé que una diferencia igual a 0 significa que ambos histogramas son iguales, pero ¿cómo puedo saber cuándo ambos histogramas son totalmente diferentes? ¿Necesito utilizar una tabla Chi-cuadrado para ello? ¿O tengo que utilizar un umbral? Básicamente quiero mapear la diferencia a porcentajes.
  3. ¿Por qué estas tres expresiones son diferentes?

4voto

Akiva Weinberger Puntos 7698

Este enlace me ha resultado muy útil: http://docs.opencv.org/2.4/doc/tutorials/imgproc/histograms/histogram_comparison/histogram_comparison.html

No sé muy bien por qué, pero OpenCV utiliza la 3ª fórmula que enumeras para la comparación de histogramas Chi-cuadrado.

En cuanto al significado, no estoy seguro de que ningún algoritmo de medición vaya a darle un rango acotado, como del 0% al 100%. En otras palabras, se puede decir con seguridad que dos imágenes son iguales: un valor de correlación de 1,0 o un valor de chi-cuadrado de 0,0; pero es difícil establecer un límite sobre lo diferentes que son dos imágenes: imagínese comparar una imagen completamente blanca frente a una imagen completamente negra, el valor numérico sería Infinito o tal vez No-un-número.

2voto

swydell Puntos 123

De hecho, puede utilizar la que considere correcta para su caso. El último es diferente. Se utiliza en distribuciones de probabilidad discretas, ya que la última será simétrica si intercambias x y y .

Los otros dos se utilizan para calcular las similitudes del histograma.

0voto

vossad01 Puntos 101

Como pidió OP, el valor en porcentaje (para la ecuación 1):

p=χS100N

W p es el porcentaje de diferencia (0. χ i N i S es el valor máximo posible en la bandeja.

Complementado según lo solicitado:

Calculando esta ecuación se puede tener el porcentaje de diferencia de un histograma completo. Calculando esto para ambos histogramas y luego restando uno del otro, se puede tener la diferencia en porcentaje.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X