9 votos

Me gustaría aprender sobre la teoría de la probabilidad, la teoría de la medida y finalmente el aprendizaje automático. ¿Por dónde empiezo?

Me gustaría aprender sobre teoría de probabilidad, teoría de medidas y, finalmente, aprendizaje automático. Mi objetivo final es utilizar el aprendizaje automático en un software.

Estudié cálculo y probabilidades muy básicas en la universidad, pero eso es prácticamente todo. ¿Conoces algunos cursos en línea o libros que podría usar para aprender sobre estos temas? He encontrado muchos recursos en la web, pero todos parecen estar dirigidos a un público experto. Sé que va a llevar algo de tiempo, pero ¿por dónde empiezo si quiero aprender desde cero?

2 votos

Estas tres preguntas parecen estar bastante bien cubiertas por los duplicados listados por @General.

13voto

Metallica Puntos 484

Creo que existen dos referencias muy buenas y populares para ti (yo también empecé con estas, teniendo un máster en ciencias actuariales):

  1. An Introduction to Statistical Learning (with application in R) by Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. Está disponible de forma gratuita en el sitio, es bastante completo y fácil de entender con ejemplos prácticos. Puedes empezar a aprender muchas cosas incluso sin tener un sólido trasfondo estadístico, esta referencia es buena para varios perfiles e incluye un número adecuado de algoritmos populares junto con su implementación en R sin adentrarse demasiado en los detalles matemáticos.

  2. The Elements of Statistical Learning by Trevor Hastie, Robert Tibshirani, Jerome Friedman. Comparado con el primero, este libro se adentra más en los aspectos matemáticos si quieres explorar más a fondo los algoritmos particulares que consideres útiles para ti. (también es gratuito)

Y por supuesto Cross Validated es una de las mejores fuentes donde puedes aprender muchas cosas, para mí: mejores prácticas, malentendidos y mal uso estadístico, y mucho más. Después de varios años de aprendizaje en escuelas/universidades así como aprendizaje autodidacta, me di cuenta de que mi conocimiento era muy limitado cuando visité Cross Validated por primera vez. Sigo visitando el sitio todos los días desde aquella primera vez y aprendo muchísimo.

3 votos

Si te gustan estas referencias, asegúrate de estar atento a los cursos en línea de Stanford. T. Hastie y R. Tibshirani suelen impartir cursos relacionados con Machine Learning.

0 votos

He leído aproximadamente el 20% de Una Introducción al Aprendizaje Estadístico con aplicaciones en R. Esto es exactamente lo que estaba buscando. Gran libro y bastante fácil de entender. ¡Muchas gracias! :)

6voto

jab Puntos 51

Aquí hay un par de cursos en línea gratuitos que he escuchado que son muy recomendados:

  • http://projects.iq.harvard.edu/stat110/home (Dependiendo de tu comodidad actual con la teoría de probabilidad. El curso del Dr. Blitzstein se volvió muy popular en Harvard incluso para aquellos que no estaban interesados en estadísticas/probabilidad. He visto algunas de las conferencias para mi propia revisión y las encontré muy útiles.)
  • https://www.coursera.org/learn/machine-learning (Esta es la versión actual de uno de los primeros cursos masivos en línea de Stanford, impartido por Andrew Ng, quien terminó cofundando Coursera. He estado queriendo tomar este curso, pero no he tenido el tiempo.)

6voto

JanithaR Puntos 141

No necesitas teoría de la medida. La teoría de la medida es utilizada por los matemáticos para justificar otros procedimientos matemáticos como tomar límites de aproximaciones de integrales. La mayoría de los ingenieros no habrían estudiado teoría de la medida, simplemente usarían los resultados. El conocimiento matemático requerido para ML es aproximadamente caracterizado por ser capaz de integrar una Gaussiana multivariante. Si te sientes seguro acerca de eso, entonces probablemente tienes el trasfondo necesario en cálculo multivariable, álgebra lineal y teoría de la probabilidad.

Recomendaría "Think Stats" de Allen Downey, que tiene como objetivo enseñar probabilidad/estadística a programadores. La idea es aprovechar la experiencia en programación para hacer simulaciones y por lo tanto entender la teoría de probabilidad/métodos estadísticos. blog de Allen Downey (ha escrito otros) Think Stats (pdf gratuito)

4 votos

La teoría de la medida es útil en procesos estocásticos de tiempo continuo. De hecho, cada artículo en finanzas de tiempo continuo (valoración de activos) comienza con la siguiente oración $(\mathcal{F},\Omega,\mathcal{P})$

1 votos

@Aksakal ¡no solo procesos continuos en mi opinión!

5voto

Aksakal Puntos 11351

Dado que estás interesado en machine learning, me saltaría la probabilidad y la medida, y me metería de lleno en el ML. El curso de Andrew Ng es un gran lugar para empezar. Literalmente puedes terminarlo en dos semanas.

Juega con lo que has aprendido durante unas semanas, luego vuelve a las raíces y estudia un poco de probabilidades. Si eres ingeniero, entonces estoy desconcertado de cómo lograste saltarlo en la universidad. Solía ser el curso requerido en ingeniería. De todos modos, puedes ponerte al día tomando el curso MIT OCW aquí.

No creo que necesites teoría de la medida. Nadie la necesita. Aquellos que la necesitan, no vendrán aquí a preguntar, porque su asesor les dirá qué curso tomar. Si no tienes un asesor entonces definitivamente no la necesitas. Tautología, pero cierto.

La cosa con la teoría de la medida es que no puedes aprenderla con una "lectura fácil". Tienes que hacer los ejercicios y problemas, básicamente, hacerlo a la manera difícil. Eso es prácticamente imposible fuera del aula, en mi opinión. La mejor opción aquí es tomar una clase en el colegio local, si ofrecen. A veces, un curso de probabilidades de nivel de doctorado incluirá la medida y las probabilidades en una misma clase, lo cual es probablemente el mejor trato. No recomendaría tomar una clase pura de teoría de la medida en el departamento de Matemáticas, a menos que realmente quieras torturarte a ti mismo, aunque al final estarías muy satisfecho.

2voto

AHugoH Puntos 63

Para agregar a las excelentes sugerencias anteriores, diría que si estás interesado en tener un firme dominio de conceptos más básicos en probabilidad y estadística, "From Algorithms to Z-Scores: Probabilistic Computing in Statistics" es un excelente manual sobre cómo utilizar computadoras para comprender algunos de los conceptos más importantes para principiantes/intermedios en teoría de la probabilidad y procesos estocásticos. También recomendaría "An Introduction to Statistical Learning" o "Elements of Statistical Learning" (ESL) como una introducción al aprendizaje automático (ML). Creo que ESL en particular es increíble, pero requiere un enfoque mucho más matemático en los conceptos de ML, por lo que si solo te consideras "bien" en estadística, puede que quieras leerlo una vez que hayas adquirido más experiencia con ML.

Si estás interesado en Machine Learning con el propósito de conseguir empleo o resolver problemas, la clave es obtener experiencia práctica. Realiza algunos cursos de introducción a ciencia de datos/aprendizaje automático. Andrew Ng ofrece una increíble introducción al aprendizaje automático en su curso en Coursera aquí. También te sugiero que descargues algunos conjuntos de datos y comiences a experimentar con ellos. Si todavía no lo has hecho, descarga R y RStudio (en mi opinión, más amigable para principiantes que Python o Matlab), y regístrate en kaggle y haz algunos de sus problemas para principiantes. Tienen excelentes tutoriales que te pueden ayudar a utilizar ML sin tener idea de lo que realmente está sucediendo, pero te dan una idea de los pasos que necesitarías tomar para implementar una solución de ML.

Yo personalmente alentaría una combinación de comenzar a usar herramientas de ML sin realmente saber qué hacen (utilizando conjuntos de datos de Kaggle u similares); y aprender conceptos fundamentales como validación cruzada, sobreajuste, uso de matrices de confusión, diferentes medidas de qué tan bueno es un modelo, etc. Para mí, es mucho más importante saber cómo usar los algoritmos, y saber cómo identificar cuándo las cosas están funcionando/no están funcionando, que entender cómo funcionan los algoritmos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X