30 votos

¿Cuáles son los mejores libros para estudiar las redes neuronales desde una perspectiva puramente matemática?

Estoy buscando un libro que recorra los aspectos matemáticos de las redes neuronales, desde el simple paso hacia adelante del perceptrón multicapa en forma matricial o la diferenciación de las funciones de activación, hasta la retropropagación en las CNN o RNN (por mencionar algunos de los temas).

¿Conoces algún libro que profundice en esta teoría? He echado un vistazo a un par (como Pattern Recognition and Machine Learning de Bishop) pero aún no he encontrado uno riguroso (con ejercicios sería un plus). ¿Tienes alguna sugerencia?

13voto

Stephen Schrauger Puntos 126

Yo recomendaría Aprendizaje profundo por Goodfellow, Bengio y Courville. No sé si lo llamaría "puramente matemático", pero cubre una buena cantidad de antecedentes matemáticos en los primeros capítulos. Sin embargo, no hay ejercicios.

7 votos

Gracias - En realidad, yo también he echado un vistazo a ese, pero aunque es bueno en la introducción de las principales herramientas matemáticas necesarias para NN, lo encontré un poco escaso cuando se trata de desarrollar adecuadamente el modelo matemáticamente.

9voto

Female Tank Puntos 992

Para los MLP, hay una derivación rigurosa en el libro de texto de optimización de Edwin Chong y Zak. Aunque es una notación pesada como todo lo relacionado con las redes neuronales debe ser.

Por alguna razón, este libro está disponible gratuitamente en Internet. Véase la página 219 de https://eng.uok.ac.ir/mfathi/Courses/Advanced%20Eng%20Math/An%20Introduction%20to%20Optimization-%20E.%20Chong,%20S.%20Zak.pdf

Creo que esencialmente no existe ningún buen libro de texto matemático sobre redes neuronales convolucionales o RNN. La gente se limita a basar su intuición en los MLP. Pero no es difícil crear una derivación matemáticamente rigurosa de la propagación hacia delante y hacia atrás de las CNN o RNN.

2 votos

"Este libro está, por alguna razón, disponible gratuitamente en Internet". Es decir probablemente una violación de los derechos de autor por parte del propietario de la página web eng.uok.ac.ir/mfathi . Pero no se lo diré a nadie si tú no lo haces ;)

7voto

Josef Knecht Puntos 41

Gilbert Strang (de las clases de álgebra lineal del MIT OCW y Introducción al álgebra lineal fame) tiene un nuevo libro de texto sobre álgebra lineal para el aprendizaje profundo, Álgebra lineal y aprendizaje a partir de datos .

Tiene un curso decente de álgebra lineal, algo de estadística y optimización, el cálculo necesario para el descenso de gradiente estocástico, y luego lo aplica todo a los modelos de redes neuronales.

1voto

P.Pet Puntos 71

Uno de mis libros favoritos sobre aspectos teóricos de las redes neuronales es el de Anthony y Bartlett: " Aprendizaje con redes neuronales Fundamentos teóricos ".

Este libro estudia las redes neuronales en el contexto de la teoría del aprendizaje estadístico. Encontrará un montón de estimaciones de las dimensiones de la CV de los conjuntos de redes y todas esas cosas divertidas.

Debo decir que este libro no entra en detalles sobre las CNN y las RNN.

1voto

Jiapeng Zhang Puntos 68

Este campo está en su fase inicial. No hay demasiados materiales para los amantes de las "matemáticas puras". Tal vez quieras echar un vistazo al curso STAT581 de Stanford (Theories of Deep Learning).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X