¿Por qué convertir el espectrograma a RGB para el aprendizaje automático?

Question

¿Por qué convertir el espectrograma a RGB para el aprendizaje automático?

Preguntado el 2 de Enero, 2022: Cuando se hizo la pregunta
226 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

He visto algunas publicaciones que alimentan una imagen RGB de un espectrograma a una red neuronal, y alguien afirma que la red funciona mejor con RGB que con escala de grises.

Un espectrograma es fundamentalmente una representación 2D en la que cada punto es un valor real no negativo. Convertirlo a RGB no añade ninguna información. Peor aún, introduce una dependencia de la elección del mapa de color, que no es más que ruido. Es peor que convertir las imágenes en escala de grises a RGB, ya que rompe las dependencias espaciales de un espectrograma al dividirlo en canales.

¿Por qué iba a superar un espectrograma RGB a la escala de grises?

Ejemplo de pub con buenos resultados, pero hay razones para sospechar incompetencia por ejemplo "[1356x1071] las imágenes se escalaron sin pérdidas a 32x32", lo cual es imposible. No hay comparación con el enfoque en escala de grises, así que no podemos saber si obtuvo mejores resultados.

Hay algunas explicaciones "triviales" que enumeraré para evitar respuestas que las contengan:

Aprendizaje por transferencia: uso de redes preentrenadas en RGB
Arquitecturas adaptadas específicamente para maximizar la utilidad del RGB

Aunque son explicaciones válidas, no demuestran que el RGB sea mejor.

Preguntado el 2 de Enero, 2022 por Ben Carlson

Answer 1

1 Respuestas

Answer 2

0voto

Truls Zhong Konstali Puntos 11

No tengo pruebas muy "sólidas", pero tengo una publicación en revisión en la que hemos entrenado a ResNet50 para que haga una regresión de algunos valores a partir de espectrogramas ruidosos.

El preentrenamiento en ImageNet es mejor que partir de una inicialización aleatoria
Para las redes preentrenadas, el uso de espectrogramas en color es mejor que los espectrogramas en escala de grises (normalizados a 0-1)

Todo lo que tengo son experimentos comparativos en un par de conjuntos de datos, así que tómalo o déjalo :)

Respondido el 4 de Junio, 2022 por Truls Zhong Konstali (11 Puntos )

¿Por qué convertir el espectrograma a RGB para el aprendizaje automático?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Por qué convertir el espectrograma a RGB para el aprendizaje automático?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: