30 votos

Lo que las teorías deberían todos estadístico saber?

Estoy pensando en esto desde muy básicos, los requisitos mínimos de la perspectiva. ¿Cuáles son las principales teorías de la industria (no académico) estadístico debe saber, comprender y utilizar sobre una base regular?

Una grande que viene a la mente es la Ley de los grandes números. ¿Cuáles son los más esenciales para la aplicación de la teoría estadística para el análisis de datos?

41voto

StasK Puntos 19497

Francamente, no creo que la ley de los grandes números tiene un papel enorme en la industria. Es útil para entender la asintótico de las justificaciones de los procedimientos comunes, tales como el máximo de estimaciones de probabilidad y pruebas (incluyendo la omniimportant GLMs y de regresión logística, en particular), el bootstrap, pero estas son las cuestiones distributivas en lugar de probabilidad de golpear un mal ejemplo de los problemas.

Más allá de los temas ya mencionados (GLM, inferencia, bootstrap), el más común de los modelos estadísticos es la regresión lineal, para una comprensión completa del modelo lineal es una necesidad. Usted nunca puede ejecutar ANOVA en la industria de la vida, pero si no lo entienden, no debe ser llamado un estadístico.

Hay diferentes tipos de industrias. En la industria farmacéutica, usted puede vivir sin estudios clínicos aleatorizados y de regresión logística. En la encuesta de estadísticas, se puede vivir sin el estimador Horvitz-Thompson y la falta de respuesta de los ajustes. En ciencias de la computación relacionados con la estadística, se puede vivir sin aprendizaje estadístico y minería de datos. En la política pública de los think tanks (y, cada vez más, las estadísticas de educación), usted puede vivir sin la causalidad y el efecto del tratamiento de los estimadores (que, cada vez más, involucrar a los ensayos aleatorios). En la investigación de marketing, usted necesita tener una mezcla de economía fondo con psicométricas de medición de la teoría (y usted puede aprender ni de ellos en un típico departamento de estadísticas ofertas). Estadísticas industriales opera con su propio y peculiar de seis sigma paradigmas que son, pero de forma remota conectada a la corriente principal de las estadísticas; un vínculo más fuerte se puede encontrar en el diseño de experimentos material. Wall Street material sería econometría financiera, todo el camino hasta el cálculo estocástico. Estos son MUY dispares habilidades, y el término "industria" es aún más mal definida que la "academia". No creo que nadie puede pretender saber más que dos o tres de los de arriba al mismo tiempo.

La parte superior de las habilidades, sin embargo, que sería universalmente obligatorios en la "industria" (sea lo que eso puede significar para usted) sería la gestión del tiempo, gestión de proyectos, y la comunicación con menos estadísticamente conocedores de los clientes. Así que si usted desea prepararse para la industria de la colocación, tomar clases en la escuela de negocios sobre estos temas.

ACTUALIZACIÓN: El artículo original fue escrito en febrero de 2012; en estos días (Marzo de 2014), probablemente debería llamar a sí mismo "un científico de datos" en lugar de "un estadista" para encontrar un trabajo caliente en la industria... y lo mejor de aprender algunos de Hadoop para seguir con la auto-proclamación.

12voto

John Richardson Puntos 1197

Creo que una buena comprensión de las cuestiones relacionadas con el sesgo de la varianza en equilibrio. La mayoría de los estadísticos se terminan, en algún punto, el análisis de un conjunto de datos es lo suficientemente pequeña como para la varianza de un estimador o de los parámetros del modelo a ser lo suficientemente alto que el prejuicio es una consideración secundaria.

11voto

Niall Puntos 51

A punto de salir el super obvia:

Teorema Del Límite Central

ya que permite a los profesionales para aproximado de $p$-valores en muchas situaciones en las que llegar exacta $p$-valores es intratable. A lo largo de esas mismas líneas, el éxito de cualquier practicante vendría bien estar familiar, en general, con

Bootstrapping

8voto

Sean Hanley Puntos 2428

Yo no diría que esto es muy similar a algo así como la ley de los grandes números o el teorema central del límite, pero porque hacer inferencias acerca de la causalidad es la frecuencia central, la comprensión de Judea Pearl trabajo sobre el uso estructurado de gráficos de modelo de causalidad es algo que la gente debe estar familiarizado con. Proporciona una manera de entender por qué experimentales y observacionales estudios difieren con respecto a las inferencias causales que pagar, y ofrece maneras para lidiar con los datos observacionales. Para una buena visión, su libro está aquí.

6voto

alexs77 Puntos 36

El Delta-Método, cómo calcular la varianza de extrañas estadísticas y encontrar su asintótico de la eficiencia relativa, recomendar los cambios de variable y explicar la eficiencia aumenta por "la estimación de la cosa correcta". Junto con eso, la Desigualdad de Jensen para la comprensión de los GLMs y extraño tipo de sesgo que surgen en las transformaciones de arriba. Y, ahora que el sesgo y la varianza se ha mencionado, el concepto de que el sesgo de la varianza de trade-off y el MSE como una medida objetiva de la precisión predictiva.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X