Estoy diseñando un año de programa en el análisis de datos con un colegio comunitario local. El programa tiene como objetivo preparar a los estudiantes para manejar las tareas básicas en el análisis de datos, visualización y resumen, avanzado de Excel habilidades y programación de R.
Me gustaría preparar un conjunto de corto, ejemplos del mundo real que ilustran donde ordinaria de la intuición falla y análisis estadístico es necesario. Yo también estoy interesado en el "famoso estadístico de falla", pero más interesado en la gana. Los datos deben ser de libre disposición.
Un ejemplo perfecto de lo que estoy buscando es el de Berkeley discriminación caso, que ilustra de la paradoja de Simpson. Los datos para que se memorice en R conjuntos de datos.
Casos históricos también son interesantes. John Nieve del análisis de la bomba de Broad Street de datos es un buen ejemplo del poder de la visualización.
Hay un montón de falla en la recolección de datos (sesgo de selección), etc. y la literatura en las estadísticas médicas está lleno de ellos.
Una gran cantidad de "estadística gana" que ocurre en el área de selección de variables y diseño de muestreo. Estoy interesado en las paradojas que se producen en otras áreas, como en el análisis como tal.