De hecho, los valores p también han pasado de moda: http://www.nature.com/news/psychology-journal-bans-p-values-1.17001 . La prueba de significación de hipótesis nula (NHST) produce poco más que una descripción del tamaño de su muestra.(*) Cualquier intervención experimental tendrá algunos lo que equivale a decir que la hipótesis nula simple de "ningún efecto" es siempre falsa en sentido estricto. Por lo tanto, una prueba "no significativa" significa simplemente que el tamaño de la muestra no era lo suficientemente grande; una prueba "significativa" significa que se han recogido suficientes datos para "encontrar" algo.
El "tamaño del efecto" representa un intento de remediarlo, introduciendo una medida en la escala natural del problema. En medicina, donde los tratamientos siempre tienen algunos (aunque sea un efecto placebo), la noción de "efecto clínicamente significativo" se introduce para protegerse de la probabilidad previa del 50% de que un "tratamiento" tenga "un efecto positivo (estadísticamente) significativo" (por minúsculo que sea) en un estudio arbitrariamente amplio.
Si comprendo la naturaleza de su trabajo, Clarinetista, al fin y al cabo, su objetivo legítimo es informar sobre acciones/intervenciones que mejoren la educación en las escuelas de su competencia. Así pues, su entorno es un Teoría de la decisión uno, y los métodos bayesianos son los más apropiados (y unívocamente coherente[1] ).
De hecho, la mejor manera de entender los métodos frecuentistas es como aproximaciones a los métodos bayesianos . El tamaño del efecto estimado puede entenderse como una medida de centralidad para el modelo bayesiano. distribución posterior mientras que el valor p puede entenderse como el objetivo de medir una cola de esa posterior. Así pues, juntos estas dos cantidades contienen una idea general de la posterioridad bayesiana que constituye la entrada natural a una perspectiva teórica de la decisión sobre su problema. (Alternativamente, un intervalo de confianza frecuentista sobre el tamaño del efecto puede entenderse igualmente como un aspirante a intervalo creíble .)
En los campos de la psicología y la educación, los métodos bayesianos son bastante populares. Una de las razones es que resulta fácil introducir "constructos" en los modelos bayesianos, como variables latentes. Si lo desea, puede consultar "El libro de los cachorros", de John K. Kruschke psicólogo. En el ámbito de la educación (donde los alumnos están agrupados en aulas, en escuelas, en distritos, etc.), los modelos jerárquicos son inevitables. Y los modelos bayesianos también son estupendos para la modelización jerárquica. En este sentido, puede que le interese consultar Gelman & Hill [2].
[1]: Robert, Christian P. La elección bayesiana: From Decision-Theoretic Foundations to Computational Implementation. 2ª ed. Springer Texts in Statistics. Nueva York: Springer, 2007.
[2]: Gelman, Andrew, y Jennifer Hill. Data Analysis Using Regression and Multilevel/hierarchical Models. Métodos analíticos para la investigación social. Cambridge ; Nueva York: Cambridge University Press, 2007.
Para saber más sobre la "coherencia" de un no-tiene-necesidad-de-golpearte-en-la-cabeza-con-un-ladrillo-bayesiano véase [3].
[3]: Robins, James, y Larry Wasserman. "Condicionamiento, probabilidad y coherencia: A Review of Some Foundational Concepts". Journal of the American Statistical Association 95, no. 452 (1 de diciembre de 2000): 1340–46. doi:10.1080/01621459.2000.10474344.
(*) En [4], Meehl azota NHST mucho más elegantemente, pero no menos abrasivamente, que yo:
Dado que la hipótesis nula es casi siempre falsa, las tablas que resumen la investigación en términos de patrones de "diferencias significativas" son poco más que resultados complejos y causalmente ininterpretables de funciones de potencia estadística.
[4]: Meehl, Paul E. "Riesgos teóricos y asteriscos tabulares: Sir Karl, Sir Ronald y el lento progreso de la psicología blanda". Journal of Consulting and Clinical Psychiatry 46 (1978): 806-34. http://www3.nd.edu/~ghaeffel/Meehl(1978).pdf
Y aquí hay una cita relacionada de Tukey: https://stats.stackexchange.com/a/728/41404