¿Es la construcción de arquitecturas de aprendizaje profundo un esquema de prueba y error?

Question

¿Es la construcción de arquitecturas de aprendizaje profundo un esquema de prueba y error?

Preguntado el 24 de Septiembre, 2017: Cuando se hizo la pregunta
2041 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

He estado leyendo muchos trabajos de aprendizaje profundo donde cada uno de ellos sigue una arquitectura diferente. No puedo ver cuál es el sentido lógico o el sentido intuitivo detrás de cada capa en cada arquitectura. Tengo la sensación de que muchas de esas arquitecturas son simplemente arbitrarias que encontramos que funcionan de forma perfecta para nuestra aplicación. No creo que la ciencia deba hacerse así. Así que estoy seguro de que me estoy perdiendo algo. ¿Puede alguien indicarme algunos conceptos e ideas generales que debería seguir para entender cómo debería diseñar mi arquitectura de aprendizaje profundo para mi aplicación? Si hay materiales/libros o lo que sea que me ayuden a tener una idea de cómo funciona el aprendizaje profundo (conozco las matemáticas, pero no la lógica o intuitivo detrás de eso) se lo agradezco.

Preguntado el 24 de Septiembre, 2017 por hbak

Answer 1

1 Respuestas

Answer 2

8voto

Jan Kukacka Puntos 1027

En la actualidad, la selección de la arquitectura de las redes neuronales se rige mucho más por los resultados empíricos que por una sólida teoría matemática. Además, la arquitectura de la red (profundidad, amplitud, funciones de activación, conexiones) no son las únicas decisiones que hay que tomar; también el algoritmo de optimización y sus parámetros interactúan estrechamente con estas elecciones. El conjunto de datos específico y la función de pérdida elegida también definen la superficie de pérdida a lo largo de la cual se está optimizando. A veces, incluso el hardware presenta una limitación (por ejemplo, la cantidad de memoria disponible en la GPU). Simplemente, no existe una respuesta universal y teóricamente fundada.

Por supuesto, hay algunos intuiciones: Por ejemplo, se sabe cómo funcionan las convoluciones, así que es fácil imaginar qué tipo de información pueden extraer. En realidad, la mayoría de los artículos que introducen algunos ajustes de arquitectura, como la normalización por lotes, la agrupación estocástica, etc., proporcionan estas pistas intuitivas. Es su trabajo considerar cuál de ellos tiene sentido en su escenario. Cualquier método de aprendizaje automático tiene sus hiperparámetros que hay que ajustar. En el caso de las redes neuronales, la arquitectura es simplemente un hiperparámetro (aunque sea oscuro).

Además, hay muchos hilos que tratan este tema:

Respondido el 4 de Febrero, 2018 por Jan Kukacka (1027 Puntos )

¿Es la construcción de arquitecturas de aprendizaje profundo un esquema de prueba y error?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Es la construcción de arquitecturas de aprendizaje profundo un esquema de prueba y error?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: