33 votos

Recomendaciones para los no técnicos, pero con un profundo artículos en las estadísticas

La inspiración para esta pregunta viene de la tarde Leo-Breiman el conocido artículo de modelos Estadísticos: Las Dos Culturas (disponible en acceso abierto). El autor compara lo que él ve como dos dispares enfoques para el análisis de datos, en lo tocante a las ideas clave en la estadística clásica y el aprendizaje de máquina. Sin embargo, el artículo es comprensible para un público amplio-probablemente para cualquier persona que trabaja con los datos, independientemente de si han perseguido estadísticas en el nivel de doctorado o sólo han tomado un curso introductorio. Por otra parte, el artículo es estimulante. Que es, fácilmente se genera el debate (como se evidencia por la serie animada de los comentarios publicados en el mismo número).

Tengo curiosidad por descubrir más artículos con estas cualidades. Esto es, artículos que:

  • Toque en los conceptos fundamentales de estadística/análisis de datos
  • Puede ser entendido por un público amplio en términos de la variación en la investigación de enfoque y estadísticas formales de formación
  • Estimular la discusión, ya sea a través de la revelación o controversia

17voto

Richard Hardy Puntos 6099

Shmueli, Galit. "Para explicar o predecir?." Estadísticas de la ciencia (2010): 289-310.

Creo que coincide con sus tres puntos de bala.

Se habla de la explicativas frente a modelos predictivos (los términos deben ser auto-explicativo), y señala que las diferencias entre ellos son a menudo no se reconoce.

Se plantea el punto de que, dependiendo del objetivo de la modelización (explicativo vs predictivo), diferentes de la construcción de modelos de estrategias podrían ser utilizados en los diferentes modelos puede ser seleccionado como "el mejor" del modelo.

Es un lugar integral de papel y una agradable lectura. Una discusión de la misma se resume en Rob J. Hyndman del blog. Una discusión relacionada con el en la Cruz Validado es en este hilo (con pérdida de upvotes). Otro (sin respuesta) pregunta sobre el mismo tema es este.

15voto

mark Puntos 232

Lehmann, Erich L. "La de Fisher, Neyman-Pearson teorías de la comprobación de hipótesis: Una teoría o dos?." Revista de la Asociación Americana de Estadística 88.424 (1993): 1242-1249.

No es conocido para muchos, pero cuando los gigantes de la profesión estaban todavía entre nosotros, ellos no se llevan bien unos con otros. El debate sobre los fundamentos de la prueba de hipótesis específicamente, si debe ser inductivo o deductivo, vio algunos bastante graves insultos vuelan alrededor de entre Fisher en una mano y Neyman-Pearson en el otro. Y el problema nunca fue setlled durante sus vidas.

Mucho después de que todos ellos han pasado, Lehmann intenta reducir la brecha y en mi opinión hace un buen trabajo como el que se muestra que los enfoques son complementarios y no se excluyen mutuamente. Esto es lo que aprenden los estudiantes en la actualidad por el camino. Usted necesita saber algunas cosas básicas acerca de la prueba de hipótesis, pero en caso contrario, puede seguir en el papel sin ningún tipo de problemas.

11voto

Nick Cox Puntos 22819

Wilk, M. B. y Gnanadesikan, R. 1968. Gráficas de probabilidad de métodos para el análisis de datos. Biometrika 55: 1-17. Jstor enlace si usted tiene acceso

Este documento es, en el momento de mi forma de escribir, de casi 50 años de edad, pero todavía se siente fresca e innovadora. Con una rica variedad de interesantes y sustancial ejemplos, los autores de unificar y extender una variedad de ideas para el trazado y la comparación de las distribuciones utilizando el marco de la Q-Q (cuantil-cuantil) y P-P (probabilidad-probabilidad) las parcelas. Distribuciones aquí significa ampliamente cualquier conjuntos de datos o de números (residuos, contrastes, etc., etc.) derivadas de su análisis.

Versiones de estas parcelas se remontan varias décadas, la mayoría, obviamente, de probabilidad normal o normal de las puntuaciones de las parcelas. los que están en estos términos cuantil-cuantil de las parcelas, es decir, las parcelas de cuantiles observados versus esperado o cuantiles teóricos a partir de una muestra del mismo tamaño de una normal (Gaussiana) de distribución. Pero los autores muestran, modestamente pero con confianza, que las mismas ideas se pueden extender fácilmente-y prácticamente con la informática moderna -- para la valoración de otros tipos de cuantiles y el trazado de los resultados automáticamente.

Los autores, a continuación, tanto en Laboratorios de la Bell Telephone, disfrutaron de estado-of-the-art centros de computación, e incluso en muchas universidades e instituciones de investigación tomó una década para ponerse al día. Incluso ahora, las ideas en este artículo merece una aplicación más amplia de lo que reciben. Es raro el texto introductorio o un curso que incluye alguna de estas ideas distinta de la normal Q-Q plot. Histogramas y diagramas de caja (a menudo muy útil, pero sin embargo cada torpe y limitado en varias formas) siguen siendo los principales alimentos básicos cuando parcelas de distribuciones son introducidos.

En un nivel personal, aunque las ideas principales de este trabajo han sido familiar para la mayoría de mi carrera, me gusta volver a leerlo cada par de años o así. Una buena razón es el placer en la forma en que los autores de rendimiento simple, pero poderoso, ideas para un buen efecto con ejemplos de lesiones graves. Otra buena razón es la forma en que el papel, que está escrito de manera concisa, sin el menor rastro de ampulosidad, alude a las extensiones de las ideas principales. Más de una vez, he redescubierto giros en las ideas principales cubiertos explícitamente en el lado sugerencias y comentarios adicionales.

Esto no es sólo un papel para los muy interesados en gráficos estadísticos, aunque en mi mente, la cual debe incluir todos los interesados en las estadísticas de cualquier tipo. Promueve formas de pensar acerca de las distribuciones que son prácticamente útil en el desarrollo de cualquiera de estadísticas de habilidades y conocimientos.

8voto

MistakeNot Puntos 16

Ioannidis, Académico E Investigador, John P. A. "¿Por Qué La Mayoría De Los Publicó Los Hallazgos De La Investigación Son Falsas." PLoS Medicine (2005)

Ioannidis, académico e investigador, John P. A. "¿Cómo Hacer Más Investigación Publicada Verdadero." PLoS Medicine (2014)

Debe lecturas por cada investigador/a estadístico/a analista que quiere evitar los peligros del uso e interpretación de estadísticas incorrectamente en la investigación. El artículo 2005 ha sido el más visitado en la historia de la Biblioteca Pública de la Ciencia, y estimuló un montón de controversia y discusión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X