85 votos

Un camino hacia la verdadera comprensión de probabilidad y estadística

Me da vergüenza decir que tengo un Doctorado y mantener un asst cátedra, pero se tropezó cuando la lectura de las estadísticas de la investigación. Estoy en un campo de Negocio que es similar a IO Psicología Social o Psicología. Yo pase demasiado tiempo a la lectura aplicada estadísticas de los libros, pero me parece que aún con todo, la lectura que no tiene una firme comprensión de lo que realmente estoy haciendo. Todo es muy 'asiento de los pantalones'. (Tan triste como parece, yo creo que esto no es una situación única entre la facultad de ciencias sociales...) El mayor problema viene cuando tengo que aplicar raramente usado stat técnica. Puedo encontrar un artículo de un matemático estadísticas diario con las ecuaciones que podría resolver mi problema, pero no tengo la matemática para convertir en código. Yo soy por siempre confiar en otros prof R de paquetes, y cruzando los dedos con la esperanza de que el trabajo (ni siquiera puedo comprobar para verificar si se hizo o no). Ya han pasado 15 años desde que tomó el Cálculo y Álgebra en el bachillerato, y creo que quiero empezar por el principio y entender verdaderamente la probabilidad y la estadística.

Estoy empezando con Gelfand del Álgebra y la Trigonometría libros para un rápido repaso de los conceptos básicos-sé que es duro de creer, pero en la investigación aplicada de campo rara vez tenemos uso para el pecado o cos. Incluso estoy tratando de finalmente conocer la forma correcta de hacer una prueba, a partir de los libros de Velleman ("Cómo demostrarlo") y Houston ("Cómo Pensar Como un Matemático") -- soy serio acerca de hacer de este derecho y la comprensión de la materia. A partir de ahí, quiero que (correctamente) a aprender el Cálculo y Álgebra Lineal I necesidad de abordar la probabilidad y la estadística. Yo estaba pensando en usar Strang del Cálculo y el Álgebra de los libros. Pero Apostol del Caculus viene muy recomendable también. Después de que estoy completamente perdida. Además, no sé cómo de lejos para ir en un Cálculo o Álgebra Lineal antes de llegar a rendimientos decrecientes. (Apóstol introduce la Probabilidad en la segunda mitad del Vol. 2 -- es de vital importancia que yo trabajo a través de todo lo anterior antes de abordar la Probabilidad?)

Así que mi pregunta es: si tuviera que hacerlo otra vez, con el objetivo de verdad, profundamente la comprensión de las estadísticas, ¿por dónde empezar? ¿Qué libros son los modernos camino para una comprensión profunda? Me gustaría seguir una moderna ruta, por lo que puedo entender de la investigación actual en las estadísticas, incluyendo enfoques Bayesianos. Pero no en una máquina contexto de aprendizaje (que parece ser la moda en el momento), en lugar de una ciencia social / diseño y análisis de experimentos / multinivel modelado de contexto. Tal vez mi objetivo sería el trabajo de Andrew Gelman; su y la Colina del libro me mostró cómo yo debería estar buscando en el modelado y estadísticas (simulación, las estimaciones de la incertidumbre en todas partes, la inferencia bayesiana, y así sucesivamente). ¿Cómo hago para volver a aprender este material con ese objetivo en mente?


Actualización 1: Posibles textos, empezando desde cero, con un enfoque en las pruebas de comprensión y profundo. No necesariamente una después de la otra.

Volver a aprender los conceptos básicos:

Cálculo (que uno(s), y qué tan profunda?):

Álgebra lineal (que uno(s) y qué tan profunda?):

Probabilidad (que uno(s)?):

Datos estadísticos básicos (cuál(es)?):

Otras sugerencias? De nuevo con el objetivo de la comprensión y el desarrollo (o, al menos, de ejecución) de los nuevos métodos de modelización jerárquica (generalizada y lineal).

57voto

Nigel Puntos 336

Como alguien que comenzó su carrera en el pensamiento de las estadísticas como un desordenado disciplina, me gustaría compartir mi epifanía sobre el asunto. Para mí, la idea vino de Álgebra Lineal, por lo que insto a empujar en esa dirección.

Específicamente, una vez que te das cuenta de que la suma de los cuadrados, $\sum_i X_i^2$, y la suma de los productos, $\sum_i X_i Y_i$, son a la vez interna de los productos (aka productos de puntos), te das cuenta de que casi todos los de las estadísticas puede ser pensado como diversas operaciones de álgebra lineal.

Si usted muestra $n$ los valores de una población, tiene un $$n-dimensional vector. La media de la muestra es una proyección de este vector en el $$n-dimensional de todos aquellos vector. La desviación estándar es la proyección en el $(n-1)$-dimensional hyperplane normal a la de todos aquellos vectores (por fin una razón intuitiva para el "$n-1$" en el denominador!). Específicamente, para la varianza de la muestra $s^2$ por ejemplo $X$, aquí está el álgebra lineal:

En primer lugar, trabajamos con las desviaciones de la media. La media en términos de álgebra lineal

$\bar{X}=\frac{\langle X,\mathbf{1}\rangle}{\langle \mathbf{1},\mathbf{1}\rangle} \mathbf{1}$

donde $\langle \cdot, \cdot \rangle$ es el interior del producto y $\mathbf{1}$ es el $$n-dimensiones del vector. A continuación, la desviación de la media

$x = X - \bar{X}$

Tenga en cuenta que $x$ es restringida a un $(n-1)$-dimensional en el subespacio. La costumbre ecuación para la varianza es

$s^2 = \dfrac{\sum_i (X_i - \bar{X})^2}{n-1}$

Para nosotros, de que

$s^2 = \dfrac{\langle x, x \rangle}{\langle \mathbf{1}, \mathbf{1} \rangle}$

que, sin entrar en demasiados detalles (demasiado tarde) es una desviación normalizada. El truco no es que el nuevo $\mathbf{1}$ tiene dimensión $n-1$.

Otro buen ejemplo es que la correlación entre dos muestras está relacionado con el ángulo entre ellos en que $$n-dimensional espacio. Para ver esto, considere la posibilidad de que el ángulo entre dos vectores $v$ y $w$ es:

$\theta = \arccos \dfrac{\langle v, w \rangle}{\|v\|\|w\|}$

donde $\|\cdot\|$ es la longitud del vector. Compare esto con uno de los formularios para la Correlación de Pearson y verás que $r = \cos \theta$.

Hay muchos otros ejemplos, y estos apenas han sido explicados aquí, pero sólo espero que para dar una impresión de cómo se puede pensar en estos términos.

9voto

akostadinov Puntos 380

Mi humilde contribución a su lista de libros: Álgebra Lineal Hecho a la Derecha por Axler. Es un libro brillante que hace un montón de cosas abstractas muy claro. Se había recomendado a mí muchas veces.

También, hace poco encontré un libro titulado Métodos Estadísticos: El Enfoque Geométrico. No he leído a través de todo de todo, pero se da una introducción muy básica a la probabilidad de un álgebra lineal perspectiva, que creo que es muy intuitivo (mucho más fácil en los ojos que mirar sigmas con un montón de azar índices siento).

(Lo siento, soy demasiado noob en este sitio web para publicar un comentario.)

6voto

user39914 Puntos 34

Yo creo, en verdad, entender profundamente las estadísticas, usted tiene que entender la teoría de la probabilidad . He aquí algunos recursos para obtener una fuerte base conceptual:

Harvard Stat 110 http://projects.iq.harvard.edu/stat110 El psets son de oro.

El MIT curso Aplicado probabilidad es de igual calidad, y se puede encontrar en edX

https://www.edx.org/course/mitx/mitx-6-041x-introduction-probability-1296

Una informativa y entretenida lectura para afinar la intuición:

http://www.amazon.com/Lady-Luck-Theory-Probability-Mathematics/dp/0486243427

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X