11 votos

Un curso de diseño experimental para los mineros de datos

Estoy un equipo científico que trabaja en la minería de datos. No es ningún secreto decir que los informáticos son bastante buenos haciendo sistemática el diseño experimental y la evaluación - el uso de los valores de p y de confianza de las estimaciones se considera avanzada :).

Lo que me gustaría saber si hay buenos cursos/material para enseñar a los científicos de la computación acerca de un buen diseño experimental. Para hacer esto más específicos, voy a agregar la siguiente información:

  • El curso debe ser dirigida a estudiantes de posgrado que puede suponer tener una comprensión razonable de la probabilidad, pero limitado de fondo en las estadísticas.
  • El curso debe centrarse en el diseño experimental en "descontrolada antinatural configuración": en otras palabras, no hay ni un físico subyacente terreno de la verdad o una forma de controlar el proceso de recolección de datos (como seres humanos). Por supuesto, un buen curso se centrará en los fundamentos, pero debe lidiar con esta situación de una manera significativa.
  • Un elemento computacional sería una ventaja, pero no es obligatoria. Nos lidiar con un montón de datos, pero se puede averiguar computacional de problemas a nosotros mismos si es necesario.

5voto

TREE Puntos 513

[Noah Smith][1] y [David Smith][2] ofreció un curso hace algún tiempo en JHU con similares motivaciones.

Esquema:

  • Clase 1: introducción, revisión de estadísticas, pruebas de hipótesis, muestreo
  • Conferencia 2: estadísticas de interés: medio, cuantiles, varianza
  • Conferencias 3-4: los experimentos con el tiempo de ejecución y "espacio"
  • Clase 5: análisis exploratorio de datos
  • Clase 6: modelado paramétrico, la regresión y clasificación
  • Clase 7: estadísticos de depuración y perfilado
  • Clase 8: resumen y revisión

Para más detalles, consulte Empírica de Métodos de Investigación en Ciencias de la computación (600.408) http://www.cs.jhu.edu/~nasmith/erm/

4voto

Scott Evernden Puntos 17858

Yo podría sugest dos libros en lugar de los cursos

La primera, como una aplicación de la bioinformática y la segunda para cualquier disciplina

Espero que ayude

3voto

John Maier Puntos 48

Buena pregunta. Estoy deseando ver las respuestas.

Desde un punto de vista estadístico dos cuestiones que es preciso abordar: la mayoría de las estadísticas y estadístico de los diseños de discutir pequeña muestra las estadísticas y la mayoría de las metodologías utilizadas por los ingenieros no son "modernas" de las estadísticas.

Yo no tengo ninguna sugerencia para el primer problema más allá de una buena educación escolar en la minería de datos/exploración y el significado de estadísticamente diferente cuando se enfrentan con el análisis de la población (o la gran muestra de las estadísticas.

Sin embargo, dos libros de interés para la introducción de los estudiantes a las estadísticas sería de Rand Wilcox (un psicólogo):

Wilcox, R. R. (2012). Introducción a la solidez de la Estimación y Pruebas de Hipótesis, 3ª Ed. Academic Press.

Wilcox, R. R. (2010). Fundamentos de los Modernos Métodos Estadísticos: Mejorar Sustancialmente la Potencia y Precisión, Springer, 2ª Ed.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X