Antecedentes: Soy estudiante de un máster en análisis estocástico. Mi curso es muy teórico, que en general me parece bien, es lo que más disfruto. De las asignaturas más afines a los datos, tengo (o voy a obtener/profundizar) conocimientos en procesos estocásticos de todo tipo, series temporales, estadística, regresión lineal. Aparte de eso, mi curso se centra en el análisis estocástico, las ecuaciones diferenciales estocásticas, la modelización espacial y los procesos puntuales.
Puedo trabajar con R, Mathematica y un poco de Python y Javascript. Y por supuesto, no hay que olvidar Excel.
Motivación: El impulso final que me llevó a escribir esta pregunta es bastante sencillo: hace poco me topé con un concurso de estudiantes de análisis de datos en mi ciudad y pensé en presentarme. Rápidamente me di cuenta de que no tengo ni idea de qué hacer con los datos. No es que no sea bueno en ello - literalmente no tengo ningún conocimiento real, aparte de ser capaz de responder a preguntas limitadas en estadística y regresión de las clases, posiblemente modelar los procesos simples si me esfuerzo.
Pero en términos más generales, simplemente creo que, puesto que soy matemático, tener conocimientos de análisis de datos es una especie de fruta madura y sería una gran pena no aprender nada al respecto.
Objetivos: Aquí está el problema. Aunque tengo una vaga idea, mi desconocimiento es tal que no sé qué es lo que quiero. Entiendo que esto no hace una pregunta bien planteada, pero espero que dar forma a mis objetivos es lo que Math.SE ayudará también. Creo que me gustaría seguir con R, ya que es un software libre que siempre podré usar (a diferencia de Mathematica), pero la elección del software es secundaria. Vagamente, me gustaría:
1) Tener los conocimientos necesarios para poder competir teóricamente en una competición de este tipo (hacerlo mal está bien, pero actualmente me estoy planteando entrar en una maratón habiendo leído sólo sobre "piernas" y "correr" en la wikipedia)
2) Ser capaz de utilizar al máximo mis conocimientos de matemáticas y convertirlos en mi punto fuerte: si compitiera contra otras personas, probablemente me aplastarían incluso aquellos que sólo tienen conocimientos básicos de estadística y series temporales, pero que son buenos trabajando con datos. Además, si pudiera incorporar de algún modo la modelización estocástica/espacial real, también sería una opción interesante.
3) Voy a intentar adivinar mis objetivos - ser capaz de hacer estadísticas básicas/regresión en R, modelar diferentes procesos, hacer experimentos con variables aleatorias de diferentes distribuciones de probabilidad, tener el conjunto de herramientas básicas para las series de tiempo. Más allá de eso realmente estaría adivinando completamente.
Preguntas : 1) ¿Qué estudio? ¿Hay temas/libros que se consideren lo básico ?
2) ¿Cómo puedo aprovechar mejor mis puntos fuertes, es decir, una mayor comprensión de las matemáticas? Digamos que si de alguna manera tuviera que comparar datos utilizando una métrica interesante que requiere un buen conocimiento de los espacios métricos para ser entendida (sí, no sé de qué estoy hablando). Por otra parte, es muy probable que cuanto más simple, mejor. Simplemente me gustaría ser consciente de los posibles puntos fuertes, pero realmente quiero ser capaz de caminar / arrastrarse correctamente primero.
3) La cuestión principal: ¿Qué recursos me recomendaría, es decir, alguien que no tiene miedo (o incluso le gustan) las matemáticas complicadas? Esto no quiere decir que un libro sencillo no pueda ser mucho más importante, pero no soy limitado a ellos.
Esta es principalmente una pregunta de solicitud de referencias (también para facilitar la respuesta, supongo), pero cualquier respuesta que consista en consejos y reflexiones generales sobre este asunto será también muy bienvenida.
Por cierto, no quiero que parezca que la competición es mi principal motivación, ya que no lo es. Es sólo que creo que es un punto de referencia útil para las habilidades de datos de la "vida real" que aprendí.
Gracias por cualquier ayuda.