Es una pregunta difícil.
Lo primero es que cualquier umbral que se elija para determinar la significación estadística es arbitrario. El hecho de que la mayoría de la gente utilice un $5\%$ $p$ -valor no lo hace más correcto que cualquier otro. Así que, en cierto sentido, hay que pensar en la significación estadística como un "espectro" y no como un tema de blanco o negro.
Supongamos que tenemos una hipótesis nula $H_0$ (por ejemplo, grupos $A$ y $B$ muestran la misma media para la variable $X$ o la media de la población para la variable $Y$ es inferior a 5). Se puede pensar en la hipótesis nula como la hipótesis de "no tendencia". Recogemos algunos datos para comprobar si podemos refutar $H_0$ (la hipótesis nula nunca se "demuestra verdadera"). Con nuestra muestra, hacemos algunas estadísticas y finalmente obtenemos una $p$ -valor . En pocas palabras, el $p$ -El valor es la probabilidad de que el puro azar produzca resultados igualmente (o más) extremos que los que obtuvimos, asumiendo por supuesto $H_0$ sea cierto (es decir, sin tendencia).
Si obtenemos una "baja" $p$ -valor, decimos que el azar raramente produce resultados como esos, por lo tanto rechazamos $H_0$ (hay pruebas estadísticamente significativas de que $H_0$ podría ser falso). Si obtenemos un "alto" $p$ -valor, entonces es más probable que los resultados sean fruto de la suerte, más que de la tendencia real. No decimos $H_0$ es cierta, sino que hay que seguir estudiando para rechazarla.
ADVERTENCIA: A $p$ -valor de $23\%$ no significa que haya una $23\%$ probabilidad de que no haya ninguna tendencia, sino que el azar genera resultados como los $23\%$ del tiempo, que suena similar, pero es una cosa completamente diferente. Por ejemplo, si afirmo algo ridículo, como "puedo predecir los resultados de tirar los dados una hora antes de que se produzcan", hacemos un experimento para comprobar la hipótesis nula $H_0:=$ "No puedo hacer tal cosa" y obtener un $0.5\%$ $p-$ valor, seguiría teniendo buenas razones para no creerme, a pesar de la importancia estadística.
Así que, con estas ideas en mente, volvamos a tu pregunta principal. Digamos que queremos comprobar si el aumento de la dosis del fármaco $X$ tiene un efecto sobre la probabilidad de que los pacientes sobrevivan a una determinada enfermedad. Realizamos un experimento, ajustamos un modelo de regresión logística (teniendo en cuenta muchas otras variables) y comprobamos la significación del coeficiente asociado a la variable "dosis" (llamando a ese coeficiente $\beta$ , pondríamos a prueba una hipótesis nula $H_0:$ $\beta=0$ o tal vez, $\beta \leq 0$ . En inglés, "the drug has no effect" o "the drug has either no or negative effect".
Los resultados del experimento arrojan una beta positiva, pero la prueba $\beta=0$ se mantiene en 0,79. ¿Podemos decir que hay una tendencia? Bueno, eso realmente disminuiría el significado de "tendencia". Si aceptamos ese tipo de cosas, básicamente la mitad de todos los experimentos que hagamos mostrarían "tendencias", incluso cuando se hagan pruebas para las cosas más ridículas.
Así que, en conclusión, creo que no es honesto afirmar que nuestro fármaco marca alguna diferencia. Lo que deberíamos decir, en cambio, es que nuestro fármaco no debería ponerse en producción a menos que se realicen más pruebas. De hecho, yo diría que deberíamos seguir teniendo cuidado con las afirmaciones que hacemos incluso cuando se alcanza la significación estadística. ¿Tomaría usted ese medicamento si el azar tuviera una $4\%$ de generar esos resultados? Por eso es fundamental la replicación de la investigación y la revisión por pares.
Espero que esta explicación, demasiado complicada, le ayude a ordenar sus ideas. El resumen es que tienes toda la razón. No deberíamos llenar nuestros informes, ya sea de investigación, de negocios o de lo que sea, con afirmaciones descabelladas apoyadas en pocas pruebas. Si realmente crees que hay una tendencia, pero no alcanzaste la significación estadística, ¡repite el experimento con más datos!
2 votos
Estos artículos me han resultado útiles Todavía no es significativo y Marginalmente significativo