Estoy tratando de elaborar un plan de estudios de matemáticas autodirigido para preparar el aprendizaje de la minería de datos y el aprendizaje automático. Esto está motivado por comenzar Clase de aprendizaje automático de Andrew Ng en Coursera y sintiendo que antes de continuar necesitaba mejorar mis habilidades matemáticas. Me gradué de la universidad hace tiempo, así que mi álgebra y estadística (específicamente de las clases de ciencias políticas/psicología) están oxidadas.
Las respuestas en el hilo ¿Es un requisito total tener una sólida formación en matemáticas para el ML? sólo sugieren libros o clases directamente relacionadas con el aprendizaje automático; ya he mirado algunas de esas clases y libros y no sé exactamente qué materia matemática estudiar (por ejemplo: ¿qué campo[s] de las matemáticas abordan la derivación de una ecuación para "minimizar una función de coste"?) En el otro hilo se sugirió ( Habilidades y cursos necesarios para ser analista de datos ) sólo menciona amplias categorías de habilidades necesarias para el análisis de datos. El hilo conductor Introducción a la estadística para matemáticos no se aplica porque no tengo ya una licenciatura en matemáticas; un hilo similar El matemático quiere tener los conocimientos equivalentes a una licenciatura en estadística de calidad tiene una lista increíble de libros de estadística, pero de nuevo, estoy buscando comenzar las matemáticas desde un recuerdo oxidado de álgebra y avanzar desde allí.
Por lo tanto, para aquellos que trabajan en el aprendizaje automático y la minería de datos, ¿qué campos de las matemáticas le parecen esenciales para realizar su trabajo? ¿Qué asignaturas de matemáticas sugeriría para preparar la minería de datos y el aprendizaje automático, y en qué orden? Esta es la lista y el orden que tengo hasta ahora:
- Álgebra
- Precálculo
- Cálculo
- Álgebra lineal
- Probabilidad
- Estadística (aquí hay muchos subcampos diferentes, pero no sé cómo desglosarlos)
En cuanto a la minería de datos y el aprendizaje automático, a través de mi trabajo actual tengo acceso a registros de actividad de sitios web/aplicaciones, transacciones de clientes/suscripciones y datos inmobiliarios (tanto estáticos como de series temporales). Espero poder aplicar la minería de datos y el aprendizaje automático a estos conjuntos de datos.
Gracias.
EDITAR:
Para la posteridad, quería compartir un útil autoevaluación de matemáticas para la obra de Geoffrey Gordon/Alex Smola Introducción al aprendizaje automático clase en la CMU.