¿Es un sólido conocimiento en matemáticas un requisito total para ML? - una respuesta y algunas especulaciones para ML conceptualizado como estadísticas ;-)
Alrededor de 1990 tenía esperanzas de que el álgebra computacional fuera de ayuda, creo que lo es pero es bastante limitado. Pero ciertamente ayuda a acelerar el aprendizaje de las matemáticas (menos necesidad de desarrollar habilidades manipulativas mediante la práctica o intentar sobrevivir solo pudiendo hacer los ejercicios simples). Encontré que el Álgebra Lineal de Fred Szabo con Mathematica fue un excelente ejemplo de esto (pero ya había tomado un curso de álgebra lineal a nivel teórico avanzado).
He estado trabajando desde 1988 (Utilizando Métodos Computacionales Intensivos para "Concretizar" Teoremas y Principios de Estadísticas - Precisamente) para hacer que la respuesta sea no o al menos no necesario (para estadísticas). Uno siempre podrá entender más rápido y más generalmente con habilidades matemáticas y comprensión adicionales. Creo que estoy empezando a acercarme, pero se necesita una representación manipulable de modelos generadores de probabilidad e inferencia que sea válida y útil para más que solo problemas simples.
¿Debería intentar llenar los vacíos en mis matemáticas antes de continuar con ML?
Eso es una tarea difícil - en mi humilde opinión casi todos los que entienden estadísticas llegaron allí sintiéndose muy cómodos manipulando las representaciones matemáticas estándar y especialmente no tan estándar de modelos generadores de probabilidad y caracterizaciones matemáticas de inferencia (el x% superior de los doctorados en estadísticas matemáticas). Así que no se trata solo de obtener lo básico sino de sentirse realmente cómodo con las matemáticas. (Como un comentario aparte, para mí la Teoría de Fourier fue esencial).
¿Por qué son estas representaciones difíciles (incluso con muchas matemáticas)?
Gerd Gigerenzer ha establecido prácticamente que no hay desafío con el simple problema de dar positivo/negativo en una enfermedad con una prueba positiva/negativa usando "frecuencias naturales". Una referencia de la pregunta vinculada parece hacer buen uso de eso http://www.autonlab.org/tutorials/prob18.pdf
¿Por qué es esto difícil de generalizar?
Para k pruebas (repetidas y/o diferentes) - 2^k
Para pruebas que toman v valores - v^k
Entonces para desconocidos binarios - 2 * v^k probabilidades de camino de muestra
Para p desconocidos binarios múltiples - 2^p * v^k
Para p desconocidos racionales múltiples Q^p * v^k
Uno rápidamente avanza a las matemáticas con infinidades contables e incontables para hacer frente a esto, lo que incluso con experiencia matemática conduce a muchos malentendidos y aparentes paradojas (por ejemplo, ¿la paradoja de Borel?)
Además, hay malentendidos peligrosos de lineal a no lineal (por ejemplo, Peligros Ocultos de Especificar Priors no Informativos Winbugs y otros MCMC sin información para distribución previa) e interacciones y efectos aleatorios, etc.
4 votos
Diría que es necesario entender muy bien álgebra lineal como mínimo y probablemente también algo de probabilidad para las aplicaciones bayesianas. También es necesario sentirse cómodo traduciendo matemáticas a código, y ser adaptable en cuanto a convenciones de notación (que no son consistentes en absoluto). El aprendizaje automático tampoco es fácil para la mayoría de los científicos de la computación.
3 votos
No creo que las preguntas estén relacionadas en absoluto. Gracias por hacer de este un sitio de stackexchange muy acogedor y cerrar la pregunta. Ni siquiera mencioné a nadie para que me recomendara un libro. Esto no es un duplicado basado en "posible duplicado"
2 votos
Hice un hilo en meta (hace 8 horas) pidiendo que se reabra esto. meta.stats.stackexchange.com/questions/1442/…
1 votos
Gracias. Aún podría cerrarse por ser "demasiado subjetiva" o "no ser una pregunta real", pero definitivamente no es un duplicado.
1 votos
Layke, como se explica en el hilo de meta iniciado por @Douglas Zare, esperamos que consideres cerrar esta pregunta como un posible favor para ti, ya que te da acceso inmediato a hilos relacionados que probablemente ya responden tu pregunta. Pero dado que has comentado que no está destinado a ser un duplicado, ¿te importaría editar tu pregunta para dejar claro en qué sentido no duplica preguntas similares en este sitio? Estaríamos encantados de volver a abrirla.
0 votos
No es necesario conocer la física para conducir un automóvil. Lo que hoy se llama "ML" está en un estado en el que puede ser tratado como un "automóvil" en mi ejemplo. Sin embargo, ayuda conocer la física, pero la ventaja es tan marginal en comparación con otras cosas que necesitas saber que no importa en muchas aplicaciones.