Aunque los cambios en la cámara o en la compresión de la imagen después del entrenamiento pueden ser graves, si es la misma, el problema es mucho menor. Por supuesto, con imágenes más ruidosas el rendimiento es menor, pero nunca he oído que la compresión JPEG estándar suponga una gran diferencia. Pero dependerá de la aplicación.
Si cambias las cosas después del entrenamiento, depende mucho. Por ejemplo, para algunas redes cambiar la resolución no funciona en absoluto. Para otras es posible. Es algo muy específico de la red. En general, cualquier cambio (incluso la lente, la iluminación, el fondo, etc.) debe evaluarse y debe incluirse en el entrenamiento desde una perspectiva teórica.
En general, no es buena idea tener datos de entrenamiento que sean cualitativamente diferentes. Si quiere clasificar PNG y JPG, lo mejor sería entrenar también con ambos. Lo mismo para otras propiedades de la imagen.
Una CNN no puede extrapolar, normalmente sólo trabaja dentro del espacio del conjunto de entrenamiento. Otros modelos pueden hacerlo, como los modelos basados en reglas.
3 votos
No tengo suficiente experiencia con las estadísticas de las imágenes para dar una respuesta segura, pero supongo que los distintos modelos utilizan esquemas completamente diferentes para codificar las imágenes en características, algunas de las cuales se verán afectadas por la compresión JPEG con pérdidas, los canales alfa, etc., y otras no, siendo los detalles específicos del modelo. Sé que existen modelos que tratan cada píxel como una característica y modelos que dividen las imágenes en regiones y utilizan las propiedades de las regiones como características.
0 votos
Qué ocurre cuando se entrena un modelo con imágenes PNG y se prueba con imágenes jpeg. El PNG tiene 4 canales de color, mientras que el jpeg sólo tiene 3. ¿Tendrá un gran efecto con respecto a su precisión en la clasificación?