1 votos

¿Cómo normalizar bien el histograma?

ACTUALIZACIÓN 2

La cuestión puede formularse como sigue:

¿Existe alguna distribución de probabilidad común, como la distribución normal, pero que tenga bordes afilados (o simplemente más afilados)? Si es así, entonces podría aproximar los datos con esta distribución.

ORIGINAL

Supongamos que tengo un histograma como el siguiente

enter image description here

y quiero normalizarlo, es decir, reescalar los valores (en la dimensión vertical), digamos, al rango [0..255].

El problema es que no está bien si tomo sólo los valores mínimos y máximos, ya que probablemente contienen brotes (como bin cerca de 100 en la imagen).

¿Hay alguna forma de calcular el mínimo y el máximo de forma estadística, algo así como 3 sigma o algo así?

Sé que puedo dejar caer algunos valores máximos y mínimos como se hace en los deportes.

ACTUALIZACIÓN

Este histograma es el resultado de la evaluación de la imagen en un espacio desconocido (aleatorio), dependiendo del color y otras propiedades de la imagen escaneada. Quiero escalarlo en el rango [0..1] para compararlo entre sí.

Considere esto como 1D imagen en escala de grises y quiero que sea de brillo y contraste uniforme.

0voto

Shabaz Puntos 403

Has dado con muchos de los problemas. Lo que deberías hacer no es una cuestión matemática, y todo lo que has sugerido es posible. Un simple escalado por 255155 es una idea razonable. Para muchos propósitos, el pico cerca de 100 no me preocuparía, no está tan lejos de la familia como para perder información sobre los otros contenedores. Si fuera tres o cuatro veces más alto que cualquier otra papelera me preocuparía más. Si se cayera del fondo, digamos que tomaría 10 cuenta la entrada a 0 es posible, pero si las proporciones entre los recipientes son importantes, no deberías hacerlo. Ciertamente, puede calcular la media y la desviación estándar, que son fórmulas bien definidas. ¿Debe excluir los puntos de más de 3σ de la media? Si la distribución fuera normal (y la mayoría no lo son: tienen colas más largas) se esperaría un punto real en 370 estar tan lejos y tienes 255 . Yo pondría el umbral de exclusión más alto, si es que lo hiciera.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X