Esta es una pregunta de debate en la intersección de las estadísticas y de otras ciencias. Yo a menudo enfrentan el mismo problema: los investigadores en el campo tienden a decir que no hay ningún efecto cuando el p-valor no es menor que el nivel de significación. En el principio, me respondió a menudo esto no es como la prueba de hipótesis obras. Dada la frecuencia con que esto surge la pregunta, me gustaría hablar de este tema con más experiencia estadísticos.
Vamos a considerar un artículo reciente en la revista científica de "el mejor grupo editorial" la Naturaleza de las Comunicaciones de la Biología (hay varios ejemplos, pero vamos a centrarnos en uno)
Los investigadores interpretan una relación no es estadísticamente significativa resultado de la siguiente manera:
Así crónica moderada restricción calórica puede extender la vida útil y mejorar la salud de un primate, pero afecta a la materia gris del cerebro integridad sin afectar cognitivas actuaciones.
Prueba:
Sin embargo, las actuaciones en el laberinto Barnes tarea no fueron diferentes entre el control y la restricción de calorías de los animales (LME: F = 0.05, p = 0.82; Fig. 2a). Del mismo modo, la evolución espontánea de la tarea de alternancia ¿ no revelan ninguna diferencia entre el control y la restricción de calorías animales (LME: F = 1.63, p = 0,22; Fig. 2b).
Los autores también sugieren que la explicación de la ausencia de efecto - pero el punto clave no es la explicación sino la afirmación de sí mismo. Los grácos se ven significativamente diferentes "a ojo" para mí (Figura 2).
Por otra parte, los autores no tienen en cuenta el conocimiento previo:
los nocivos efectos de la restricción calórica sobre el rendimiento cognitivo se han reportado para las ratas y cerebral y las funciones emocionales en los seres humanos
Puedo entender el mismo reclamo por el enorme tamaño de la muestra (sin efecto = no hay prácticamente efecto significativo), sino en la particular situación compleja se utilizaron las pruebas y no es obvio para mí de cómo realizar el cálculo de la potencia.
Preguntas:
Hice pasar por alto detalles que hacen de sus conclusiones válidas?
Teniendo en cuenta la necesidad de informe negativo de los resultados en la ciencia, como para demostrar que no es "la ausencia de resultado" (que tenemos con $p > \alpha$), pero "resultado negativo (por ejemplo, no hay ninguna diferencia entre los grupos)" el uso de las estadísticas? Entiendo que para grandes tamaños de muestra incluso las pequeñas variaciones en null provocar rechazo, pero supongamos que tenemos los datos ideales y aún debe demostrar que null es prácticamente cierto.
Debe estadísticos siempre insisten en que matemáticamente correctas conclusiones como "tener este poder no fueron capaces de detectar el efecto de tamaño significativo"? Los investigadores de otros campos desagrada tales formulaciones de resultados negativos.
Yo estaría encantado de escuchar cualquier pensamiento sobre el problema y he leído y entendido las preguntas relacionadas con este sitio web. No hay una respuesta clara a las preguntas 2)-3) desde el punto de vista de las estadísticas, pero me gustaría entender cómo esta pregunta tiene que ser contestada en caso de diálogo interdisciplinario.
UPD: me parece un buen ejemplo de resultado negativo es la 1ª etapa de ensayos médicos, de seguridad. Cuando los científicos pueden decidir que el medicamento es seguro? Supongo que comparar dos grupos y hacer estadísticas sobre este tipo de datos. Es allí una manera de decir que este medicamento es seguro? Cochrane utiliza exacta "ningún efecto secundario fueron encontrados", pero los médicos dicen que este medicamento es seguro. Cuando el equilibrio entre la precisión y la sencillez de la descripción de los mets, y podemos decir "no hay ninguna consecuencia para la salud"?