En respuesta a un creciente cuerpo de estadísticos e investigadores que criticar la utilidad de null-pruebas de hipótesis (NHT) para la ciencia como un acumulado esfuerzo, la Asociación Americana de psicología de la Fuerza de Tarea en la Inferencia Estadística evitar una prohibición total de NHT, pero en lugar sugerido que los investigadores informe de los tamaños del efecto además de los p-valores derivados de NHT.
Sin embargo, los tamaños del efecto no se acumula fácilmente a través de los estudios. Meta-analítica de los enfoques se pueden acumular las distribuciones de los tamaños del efecto, pero los tamaños del efecto son normalmente se calcula como una relación entre primas efecto de magnitud e inexplicable "ruido" en los datos de un experimento dado, lo que significa que la distribución de los tamaños del efecto no sólo se ve afectada por la variabilidad en el raw de la magnitud del efecto entre los estudios, sino también la variabilidad en la manifestación de ruido a través de los estudios.
En contraste, una medida alternativa de los efectos de la fuerza, cocientes de probabilidad, permiso de ambos intuitiva interpretación en un estudio realizado por el estudio de base, y puede ser fácilmente agregados a través de los estudios de meta-análisis. Dentro de cada estudio, la probabilidad representa el peso de la evidencia para un modelo que contiene un determinado efecto en relación a un modelo que no contienen el efecto, y normalmente puede ser reportado como, por ejemplo, "Cálculo de un cociente de probabilidad para el efecto de X revelaron 8 veces más evidencia para el efecto de que por parte de sus respectivos null". Por otra parte, el cociente de probabilidad también permite la representación intuitiva de la fuerza de los nulos resultados en la medida de lo cocientes de probabilidad por debajo de 1 representan escenarios donde el null es favorecida y tomando el recíproco de este valor representa el peso de la evidencia para la nulos sobre el efecto. En particular, el cociente de probabilidad se representa matemáticamente como la proporción de inexplicables de las varianzas de los dos modelos, que difieren sólo en la varianza explicada por el efecto y por lo tanto no es una gran conceptual de partida de un tamaño del efecto. Por otro lado, el cálculo de un meta-analítica de razón de verosimilitud, lo que representa el peso de la evidencia de un efecto a través de los estudios, es simplemente una cuestión de tomar el producto de los coeficientes de probabilidad a través de los estudios.
Por lo tanto, sostengo que para la ciencia busca establecer el grado de bruto evidencia en favor de un efecto/modelo, cocientes de probabilidad son el camino a seguir.
Hay más matices en los casos donde los modelos son diferenciables sólo en el tamaño específico de un efecto, en cuyo caso algún tipo de representación de los intervalos sobre los cuales creemos que los datos son consistentes con el efecto de los valores de parámetro podría ser el preferido. De hecho, la APA task force recomienda también que los informes de los intervalos de confianza, que pueden ser utilizados para este fin, pero sospecho que esto también es un mal enfoque considerado.
Los intervalos de confianza son lamentablemente a menudo mal interpretada (por parte de los estudiantes y los investigadores por igual). También le tengo miedo a que su capacidad para el uso en NHT (por la evaluación de la inclusión de cero dentro de la CI) sólo sirven para retrasar aún más la extinción de NHT como un inferencial de la práctica.
En cambio, cuando las teorías son diferenciables sólo por el tamaño de los efectos, no sugieren que el enfoque Bayesiano, sería más apropiado, donde la distribución previa de cada efecto es definido por cada modelo por separado, y el resultado de las distribuciones posteriores de la comparación.
¿Este enfoque, la sustitución de los valores de p, los tamaños del efecto y los intervalos de confianza con cocientes de probabilidad y, si es necesario, la comparación de modelos Bayesianos, parecen suficientes? No se pierda en algunos inferencial característica que el aquí denostado-proporcionar alternativas?