Acabo de ver una conferencia sobre la inferencia estadística ("la comparación de proporciones y medios"), parte de una introducción a las estadísticas de curso en línea. El material hecho tan poco sentido para mí, como siempre lo hace (por ahora debo de haber visto esto docenas de veces, distribuidas en las tres últimas décadas).
Estoy buscando un libro sobre "Estadísticas básicas-101" (punto de estimación, estimación de evaluación, inferencia estadística, la prueba de hipótesis, el diseño del estudio) que se toma en serio el problema de convencer a un escéptico lector...
A continuación doy algunos ejemplos del tipo de pregunta que el autor que estoy buscando tomaría en serio y saben cómo abordar de manera convincente.
Pero primero permítanme tomar un minuto para el estrés que en este post no estoy haciendo estas preguntas. Por favor, no responder a ellos! Yo les doy sólo como ejemplos, y a modo de "prueba de fuego" (por el tipo de autor de búsqueda).
Si una "proporción" es simplemente la media de una variable Booleana (es decir, que sólo toma los valores 0 y 1), ¿por qué son diferentes los procedimientos enseñados para hacer inferencia estadística con "proporciones" y con "medios"?
Si la distribución normal es tan robusta que la asunción de la normalidad da buenos resultados incluso en los casos cuando los datos no es muy distribuye normalmente, y si la distribución t es tan normales, ¿por qué todo el alboroto sobre el uso de la distribución t en lugar de la normal?
Lo que exactamente son "grados de libertad", y ¿por qué nos preocupa?
¿Qué significa hablar de que el "verdadero" valor de un parámetro, teniendo en cuenta que estamos usando sólo las distribuciones que pasar a buscar similares a los datos?
¿Por qué "análisis exploratorio de datos" es una buena cosa, mientras que "el espionaje de datos" es una mala cosa?
Como he dicho, me ponen fuera por la actitud que implica un abandono de ese tipo de preguntas. No es la "postura epistemológica" que quiero ver en alguien que enseñarme algo. Estoy buscando autores que respeto el lector del escepticismo y de la racionalidad, y que saben cómo dirigirse a ellos (sin necesidad de ir a las páginas y páginas de formalismos y tecnicismos).
Me doy cuenta de que esta es una tarea difícil, y tal vez especialmente cuando se trata de estadísticas. Por lo tanto, no espero que muchos autores han tenido éxito en ello. Pero en el momento en que yo iba a ser contenido con la búsqueda de sólo uno.
Permítanme añadir que no estoy de matemáticas de aversión. Por el contrario, me encantan las matemáticas. (Me siento cómodo con el análisis de [aka "cálculo avanzado"], álgebra lineal, teoría de la probabilidad, incluso básicos de la teoría de la medida.)
Dicho esto, mi interés en este momento es en "aplicar", "práctico", "diario", "mundo real" de las estadísticas (en oposición a teórico sutilezas). (Pero no quiero un libro de cocina!)
FWIW, he leído los primeros capítulos de análisis de Datos utilizando la regresión multinivel y/modelos jerárquicos por Gelman y de la Colina, y me gusta que los autores de tono. Su enfoque es práctico, pero ir en la teoría cuando sea necesario. También a menudo un paso atrás y evaluar las prácticas estándar de la crítica, y ofrecemos sinceras opiniones que apelar a un escéptico lector del sentido común. Por desgracia, estos autores no han escrito un libro dedicado al tema estoy preguntando acerca de la de este post ("Estadísticas de 101 cosas", como se describió anteriormente). También estoy consciente de que uno de estos autores (Gelman), co-autor del muy respetado Bayesiano de análisis de datos, pero, de nuevo, esto no es lo que estoy buscando en este momento.
EDITAR:
Dikran Marsupial se plantea el siguiente objeción:
Creo que no es necesariamente algo malo con la descuidar preguntas, llega un punto en que la respuesta a cada pregunta le resta valor a la exposición de los conceptos básicos que a menudo es más importante (especialmente en las estadísticas de 101 libro!).
Estoy de acuerdo con eso. Sería más exacto decir que estoy en busca de una "segunda mirada a las estadísticas básicas." De hecho, con este como mi motivación, me miró a los libros de texto utilizados en cursos de posgrado en la inferencia (por ejemplo), y encontraron que demasiado descuidado preguntas como las que he enumerado. Si acaso, parecía aún menos dispuestos a profundizar en estas preguntas (de modo que puedan centrarse en las cuestiones como las condiciones para la convergencia-o-otras de este o aquel...).
El problema es que el más avanzado de los libros dirigidos a un radicalmente diferente de la población de los lectores, donde el "escepticismo de los de afuera" ha sido drásticamente disminuido. IOW, aquellos que están tomando a nivel de posgrado estadísticas están más allá del punto de ser molestado por las preguntas que me molestan. No son escépticos acerca de cualquiera de estas cosas más. (¿Cómo superar el escepticismo joroba? Tal vez algunos nunca fueron demasiado crítica en el primer lugar, especialmente si ellos aprendieron sus stats bastante pronto-sé que yo no era particularmente crítico de primer año de mi mismo, por ejemplo, a pesar de que yo no tome las estadísticas de entonces. Otros pueden haber tenido profesores que llenaron en donde sus libros de texto se quedó corto. Algunos pueden haber sido lo suficientemente inteligente como para averiguar las respuestas a estas preguntas por sí mismos. Quién sabe.)