1 votos

Transfer learning en imágenes con un rango dinámico más alto

¿Es posible ajustar un modelo basado en CNN previamente entrenado en imágenes en escala de grises con una profundidad de 8 bits [0 ~ 2^8] para que se ajuste a imágenes con una profundidad de 16 bits [0 ~ 2^16]?

Si hay algún artículo de investigación que lo confirme, sería genial si pudieras compartirlo

1voto

mclaughlinj Puntos 1099

En la mayoría de las aplicaciones, las CNN tratan los valores de píxeles como una variable continua que varía (sin pérdida de generalidad) de 0 a 1. No hay una diferencia sustancial entre asignar 256 valores discretos a un rango continuo, en comparación con asignar 65536 valores a este rango continuo.

NB - "rango dinámico alto" es un término muy sobrecargado. Literalmente, significa "usar más bits por píxel para almacenar un rango más amplio de valores de brillo". Muchos estándares de almacenamiento de información "HDR" lo hacen en espacio lineal, en lugar de en algún espacio "uniforme perceptual". Por lo tanto, es fácil (y común) confundir "HDR" con "espacio de color lineal de 16/32 bits". Creo que sería un error usar una CNN en valores lineales en lugar de uniformes perceptuales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X