Processing math: 100%

48 votos

Por dónde empezar con las estadísticas de un desarrollador con experiencia

Durante el primer semestre de 2015 hice el curso de coursera de Aprendizaje de Máquina (por Andrew Ng, GRAN curso). Y aprendido los conceptos básicos de aprendizaje de máquina (regresión lineal, regresión logística, SVM, Redes Neuronales...)

También he sido desarrollador de 10 años, por lo que el aprendizaje de un nuevo lenguaje de programación no sería un problema.

Últimamente, he comenzado el aprendizaje de R con el fin de implementar algoritmos de aprendizaje automático.

Sin embargo, me he dado cuenta de que si quiero seguir aprendiendo que voy a necesitar una más formal conocimiento de la estadística, en la actualidad tengo un no-formal conocimiento de él, pero es tan limitada que, por ejemplo, yo no podía determinar correctamente que de varios modelos lineales sería mejor (normalmente tiendo a usar R-cuadrado para ella, pero al parecer eso no es una muy buena idea).

Así que a mí me parece bastante obvio que necesito para aprender los conceptos básicos de la estadística (yo estudio en la uni, pero olvidó la mayoría de ella), donde debo aprender, por favor, tenga en cuenta que realmente no necesitas un curso completo, algo que dentro de un mes me permite saber lo suficiente como para que yo pueda hacer con ganas y aprender más :).

Hasta ahora he leído acerca de "Estadísticas sin lágrimas", cualquier otra sugerencia?

26voto

Dawny33 Puntos 1811

Yo sugeriría que usted básica mapa de carreteras acerca de cómo ir sobre él:

Bono:

Un sitio maravilloso para tales mapas de carreteras es Metacademy, que personalmente me avalan como uno de los mejores de Datos de recursos de la Ciencia en la web.

Gitxiv es otro hermoso lugar, que conecta el Arxiv trabajos de investigación en Ciencia de Datos con el correspondiente código abierto implementaciones de las bibliotecas.

12voto

Steve S Puntos 783

Ha revisado bien Creo Estadísticas o Pensar de Bayes--ambos son (gratis) estadísticas de libros orientados hacia los programadores y con un montón de código en Python.

También, si usted está interesado en el aprendizaje de R , a continuación, CRAN tiene un montón de (gratis) los archivos pdf que usted puede ser que desee comprobar hacia fuera, como Introducción a la Probabilidad y Estadística con R. También hay un curso de Coursera que utiliza R que un montón de gente realmente amor (que utilice este libro de texto, que usted puede ser que desee comprobar hacia fuera así, y tienen laboratorios en DataCamp, creo).

También, si quieres practicar en un par de Stats temas siempre se puede ver un par de videos de Khan Academy.

8voto

Aksakal Puntos 11351

Si alguna vez, incluso en un pasado lejano, capaz de resolver problemas en esta lista, entonces usted debe tratar de estudio aplicado estadísticas "correctamente". Te voy a dar un sencillo de dos paso del algoritmo.

En primer lugar, familiarizarse con la teoría de la probabilidad. Hay muchos grandes libros. Mi favorito es el libro clásico por Feller. Se llama "Introducción", pero no se deje engañar por el título, es tan profunda como la que usted desea ir, sin embargo, muy bien escrito y simple, si usted sólo quiere rozar la superficie.

El segundo paso es la estadística. De nuevo, hay un montón de grandes libros. Te voy a dar uno que he usado, una decente de introducción de texto por Gujarati "Básicos de la Econometría", Cuarta Edición. La econometría es la estadística aplicada a la economía. Para una referencia, un tipo que todo el mundo piensa, dijo que los datos científico va a ser una más sexy de trabajo en los próximos 10 años es Hal Varian, economista de Berkeley. Un montón de máquina de aprendizaje de la materia se basa en estadísticas básicas, regresiones, etc. Todo lo que está cubierto en este libro, y usted no necesita leer de todo, está escrito en una manera que usted puede escoger los capítulos en su propio orden.

Usted se sorprenderá de ver cómo muchos de los vacíos que deja abierta después de Ng de la clase están llenando rápidamente, mientras que la lectura de estos textos.

Como profesional, usted no necesita demasiada teoría después de estos dos pasos. Usted puede seguir aprendiendo ML técnicas específicamente la lectura de los libros en este campo. Es importante no ser demasiado profundo en el inicio en la probabilidad y estadísticas. Obtén tu código va por ML en primer lugar, y a llenar los vacíos que se van.

4voto

user25694 Puntos 6

Todo el mundo está recomendando Casella Y Berger, que es casi universalmente utilizado en posgrado los programas de estadística. No es un mal libro de referencia, pero no estoy seguro de que me iba a hacer más que digitalizar los primeros 4 o 5 capítulos. No creo que se necesite la teoría de cómo construir una Neyman-Pearson tipo de prueba antes de profundizar en "estadísticas", es decir, el análisis de los datos.

En lugar de eso, me concentraría en los métodos de aprendizaje. Mi programa de posgrado utilizado Aplicado Lineal Métodos Estadísticos para la frecuentista pruebas, y una bastante decente de referencia general, pero podría no ser el más accesible libro de auto-enseñanza de punto de vista. Un curso o dos en el MIT o coursera podría ser una mejor manera de empezar en eso, porque tendrás una visión más amplia con más ejemplos de lo que usted podría partir de la lectura de un libro.

Para Bayes, el libro he visto que se utiliza con mayor frecuencia es la de Hacer Bayesiano de Análisis de Datos, la cual viene con el cachorro imágenes (claramente, esto hace que el libro superior a la de otros Bayesiano de introducción de los libros de texto). Yo nunca he usado el mismo libro, pero he paginar a través de ella y parece bastante decente, mucho mejor que la de Gelman libro, que me pareció un poco incomprensible, DESPUÉS de dos clases en la estadística Bayesiana - las explicaciones son terribles.

3voto

Gorpik Puntos 7276

Esto no pretende ser una respuesta completa, es sólo una sugerencia. Si usted desea aprender más acerca de las estadísticas (la fundación), se podía leer:

Casella, G. and R. L. Berger (2002): Statistical Inference, Duxbury

Este es un bonito libro estándar para los estadísticos, y tiene un montón de interesantes resultados. Usted no necesita ir a través de todas las pruebas de los teoremas, pero es posible que desee hacer algunos ejercicios con el fin de sentirse más seguro con los resultados.

Si usted desea aprender más acerca de la econometría (modelos para datos), puedes echar un vistazo en:

Hayashi, F. (2000): Econometrics, Princeton University Press

Alguien preguntó algo similar a lo que usted solicitó y obtuvo una buena respuesta: Qué hacer después de "Casella Y Berger".

Además, si realmente la intención de la lectura de estos libros, este plan de estudios de un curso de econometría puede dar una muy buena dirección y el ritmo en qué leer (CB & Hayashi) y cuando a leer.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X