1 votos

¿Cómo tratar los cambios de tamaño de los fotogramas de vídeo en una CNN?

¿Cómo tratar los vídeos en los que el tamaño de los fotogramas no es el mismo fotograma a fotograma?

Por ejemplo este vídeo se mueve hacia arriba y hacia abajo y, cuando lo hace, la parte de vídeo de la pantalla tiene una cantidad diferente de píxeles en vertical.

¿Cómo tratar diferentes tamaños de marco en una CNN?

0voto

Thomas W Puntos 143

Creo que una pregunta mejor sería: ¿Debería tratar con diferentes tamaños de fotogramas de vídeo. En primer lugar, el vídeo enlazado tiene lo mismo tamaño de fotograma en todo el vídeo. Sólo se ha rellenado con un borde negro. Esto no debería ser un problema para su CNN .

Si se ha entrenado una CNN lo suficientemente bien como para detectar caras, por ejemplo, no importa que haya un borde negro acolchado alrededor de la parte "activa" del vídeo. No cambiará la capacidad de reconocimiento facial.

0voto

Ryan Puntos 116

La cantidad de píxeles no cambia en el vídeo, pero sí la sección que le interesa en cada fotograma.
Una forma de solucionarlo es utilizar técnicas de segmentación de imágenes, es decir, en cada paso temporal se puede extraer la imagen del fondo y alimentar la CNN con ella. Si el número de píxeles no es exactamente el mismo en cada marca temporal después de la segmentación, puedes simplemente reescalar las imágenes a una forma fija.
En cualquier caso, una CNN podría tratar fácilmente este tipo de imágenes en bruto tal cual, debido a la propiedad de invariancia de traslación que le confieren los pasos de convolución + pooling. Piense que una CNN puede reconocer un gato independientemente de la posición en la que se encuentre en una imagen.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X