15 votos

Redes neuronales profundas: ¿sólo para clasificación de imágenes?

Todos los ejemplos que he encontrado que utilizan redes neuronales convolucionales o de creencia profunda las emplean para la clasificación de imágenes, la detección de chatacteres o el reconocimiento del habla.

¿Son también útiles las redes neuronales profundas para tareas de regresión clásicas, en las que las características no están estructuradas (por ejemplo, no están ordenadas en una secuencia o cuadrícula)? En caso afirmativo, ¿puede dar un ejemplo?

3 votos

Tu primera frase trae a colación las redes neuronales convolucionales. Parece que las confunde con las redes neuronales profundas. No son lo mismo, aunque ambas son formas de redes neuronales.

1 votos

Yo estaría de acuerdo con @msalters, pero diría que las redes profundas de creencia son realmente redes profundas, y han tenido un éxito limitado, mientras que las redes convolucionales son más como un híbrido - filtros de imagen adaptativos s en capas convolucionales seguidas de nn poco profundas.

0 votos

¿Qué quiere decir con que las "observaciones" "no están estructuradas (no están ordenadas en una secuencia o cuadrícula)"? ¿Se refiere a que las imágenes están "estructuradas" en el sentido de que los píxeles individuales están dispuestos en una cuadrícula? Entonces, ¿son las características las que están "estructuradas", no las "observaciones" (que serían imágenes individuales)?

8voto

Chris Puntos 7877

Las características de las imágenes que las hacen susceptibles de clasificación con una red neuronal profunda es que tienen un montón de características (posiblemente millones, si no miles de millones, de píxeles con RGB, intensidad, etc.) y, si tienes etiquetas precisas, no son datos ruidosos. Las cámaras de hoy en día son muy buenas y no miden mal nada. Gracias a Internet, ahora tenemos un montón de imágenes etiquetadas con precisión. Una red profunda puede expresar funciones arbitrariamente complicadas, lo cual es un problema con datos ruidosos porque es muy fácil sobreajustar el ruido, de ahí que muchos métodos de aprendizaje tiendan a penalizar los modelos complicados. Sin embargo, en el caso del reconocimiento de imágenes, la función real parece ser muy complicada, no tenemos ni idea de cómo es la forma funcional y ni siquiera sabemos cuáles son las características relevantes en muchos casos. Una red multicapa puede descubrir y extraer automáticamente las características relevantes, lo que no la hace completamente única, pero es una parte atractiva del modelo.

Esto no significa que no se puedan utilizar redes profundas para aprender funciones que no tengan nada que ver con las imágenes. Solo hay que tener mucho cuidado con las desventajas, sobre todo que son muy propensas al sobreajuste, pero también que son costosas desde el punto de vista computacional y puede llevar mucho tiempo entrenarlas (no es un problema tan grave hoy en día con los SGD paralelizados y las GPU). La otra desventaja es la escasa o nula interpretabilidad del modelo, que no es realmente importante para la clasificación de imágenes. Sólo intentamos que los ordenadores reconozcan la diferencia entre un chimpancé y un orangután. La comprensión humana de la fórmula no importa. Para otros ámbitos, especialmente el diagnóstico médico, la investigación política, etc., se necesita o incluso puede ser necesaria la comprensión humana.

5voto

Dail Puntos 274

Claro que se pueden utilizar redes neuronales profundas para muchos problemas, aparte del reconocimiento de imágenes o del habla. El problema es si realmente lo necesitas.

Las redes neuronales profundas son mucho más potentes que un simple MLP, pero también requieren más recursos y son más difíciles de desarrollar. Por eso se utilizan en dominios realmente complejos. Podrían utilizarse para resolver problemas más sencillos, pero normalmente los modelos más simples también obtienen buenos resultados.

Usar redes neuronales profundas para problemas fáciles será como matar moscas con un bazooka, seguro que las matarás pero ¿no podrías encontrar una forma más sencilla?

2 votos

Esto no es una respuesta. ¿Qué es fácil y qué es difícil? Predecir el mercado de valores/extrapolar a partir de ejemplos limitados/... ¿Hay muchos problemas difíciles? ¿Son las redes profundas buenas en todos ellos?

0 votos

No he dicho que las redes neuronales profundas puedan resolver nada. Lo que quería decir es que se utilizan en dominios complejos en los que hay un gran número de entradas. Sé que no pueden resolver todos los problemas, pero no es el tema de esta pregunta. El punto es enfatizar que podrían ser aplicadas a otros problemas aparte del reconocimiento de imagen/voz pero tienen desventajas que vale la pena considerar en los casos donde otros modelos podrían ser aplicados.

5voto

user777 Puntos 10934

Estoy de acuerdo con la respuesta de davidivad. Pero también creo que la aplicación de redes neuronales profundas a las imágenes es que las imágenes (y, más importante, etiquetado imágenes) son relativamente baratas de recopilar. En otros ámbitos, puede resultar muy costoso recopilar datos a gran escala, sobre todo dentro de las limitaciones de una empresa industrial o gubernamental típica. Para agravar este problema, en muchas aplicaciones el fenómeno de interés es relativamente raro, por lo que habrá muy pocos ejemplos de los que aprender, de modo que incluso un esfuerzo de recopilación de datos relativamente a gran escala podría producir un pequeño número de miembros de alguna clase.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X