60 votos

¿Por qué los estadísticos dicen que un resultado no significativo significa "no puedes rechazar la hipótesis nula" en lugar de aceptar la hipótesis nula?

Las pruebas estadísticas tradicionales, como la prueba t de dos muestras, se centran en tratar de eliminar la hipótesis de que no hay diferencia entre una función de dos muestras independientes. Entonces, elegimos un nivel de confianza y decimos que si la diferencia de medias está más allá del 95%, podemos rechazar la hipótesis nula. De lo contrario, "no podemos rechazar la hipótesis nula". Esto parece implicar que tampoco podemos aceptarla. ¿Significa que no estamos seguros si la hipótesis nula es verdadera?

Ahora, quiero diseñar una prueba donde mi hipótesis es que una función de dos muestras es la misma (lo cual es lo opuesto a las pruebas estadísticas tradicionales donde la hipótesis es que las dos muestras son diferentes). Entonces, mi hipótesis nula se convierte en que las dos muestras son diferentes. ¿Cómo debo diseñar una prueba así? ¿Será tan simple como decir que si el valor p es menor al 5% podemos aceptar la hipótesis de que no hay diferencia significativa?

0 votos

La diferencia de medias está más allá del nivel del 95%, podemos rechazar la hipótesis nula. El 95% no es un "nivel", está aquí en 95 casos de cada 100 casos (comparaciones), la diferencia en la estadística de muestra surge debido a fluctuaciones de muestreo. Significa que la hipótesis nula se acepta en alfa = .05. Decir el nivel del 95% no es un término correcto.

57voto

Sean Hanley Puntos 2428

Tradicionalmente, la hipótesis nula es un valor puntual. (Normalmente es $0$, pero de hecho puede ser cualquier valor puntual). La hipótesis alternativa es que el valor real es cualquier valor que no sea el valor nulo. Debido a que una variable continua (como una diferencia de medias) puede tomar un valor que esté indefinidamente cerca del valor nulo pero aún no sea igual y por lo tanto hacer que la hipótesis nula tradicional sea falsa, una hipótesis nula puntual tradicional no puede ser probada.

Imagina que tu hipótesis nula es $0$, y la diferencia de medias que observas es $0.01$. ¿Es razonable asumir que la hipótesis nula es verdadera? Aún no lo sabes; sería útil saber cómo se ve nuestro intervalo de confianza. Digamos que tu intervalo de confianza del 95% es $(-4.99, 5.01)$. Ahora, ¿deberíamos concluir que el valor real es $0$? No me sentiría cómodo diciendo eso, porque el intervalo de confianza es muy amplio, y hay muchos valores no nulos grandes que podríamos sospechar razonablemente son consistentes con nuestros datos. Así que digamos que recopilamos mucha, mucha más información, y ahora nuestra diferencia de medias observada es $0.01$, pero el 95% del CI es $(0.005, 0.015)$. La diferencia media observada se ha mantenido igual (lo cual sería increíble si realmente sucediera), pero el intervalo de confianza ahora excluye el valor nulo. Por supuesto, esto es solo un experimento mental, pero debería aclarar las ideas básicas. Nunca podemos demostrar que el valor real es algún valor puntual en particular; solo podemos (posiblemente) refutar que sea algún valor puntual. En la prueba de hipótesis estadísticas, el hecho de que el valor p sea > 0.05 (y que el 95% del CI incluya cero) significa que no estamos seguros si la hipótesis nula es verdadera.

En cuanto a tu caso concreto, no puedes construir una prueba donde la hipótesis alternativa sea que la diferencia de medias es $0$ y la hipótesis nula sea cualquier cosa que no sea cero. Esto viola la lógica de la prueba de hipótesis. Es perfectamente razonable que sea tu hipótesis sustantiva y científica, pero no puede ser tu hipótesis alternativa en una situación de prueba de hipótesis.

Entonces, ¿qué puedes hacer? En esta situación, utilizas pruebas de equivalencia. (Podrías querer leer a través de algunas de nuestras discusiones sobre este tema haciendo clic en la etiqueta de equivalencia). La estrategia típica es utilizar el enfoque de las dos pruebas unilaterales. Muy brevemente, seleccionas un intervalo dentro del cual considerarías que la verdadera diferencia media podría muy bien ser $0$ por todo lo que te importa, luego realizas una prueba unilateral para determinar si el valor observado es menor que el límite superior de ese intervalo, y otra prueba unilateral para ver si es mayor que el límite inferior. Si ambas pruebas son significativas, entonces has rechazado la hipótesis de que el valor real está fuera del intervalo que te importa. Si una (o ambas) no son significativas, no logras rechazar la hipótesis de que el valor real está fuera del intervalo.

Por ejemplo, supongamos que cualquier cosa dentro del intervalo $(-0.02, 0.02)$ está tan cerca de cero que piensas que es esencialmente lo mismo que cero para tus propósitos, así que lo usas como tu hipótesis sustantiva. Ahora imagina que obtienes el primer resultado descrito anteriormente. Aunque $0.01$ está dentro de ese intervalo, no podrías rechazar la hipótesis nula en ninguna de las pruebas unilaterales, por lo que no rechazarías la hipótesis nula. Por otro lado, imagina que obtienes el segundo resultado descrito anteriormente. Ahora encuentras que el valor observado está dentro del intervalo designado, y se puede demostrar que es tanto menor que el límite superior como mayor que el límite inferior, por lo que puedes rechazar la hipótesis nula. (Vale la pena señalar que puedes rechazar ambas la hipótesis de que el valor real es $0$, y la hipótesis de que el valor real está fuera del intervalo $(-0.02, 0.02)$, lo cual puede parecer desconcertante al principio, pero es totalmente coherente con la lógica de las pruebas de hipótesis.)

2 votos

"Tradicionalmente, la hipótesis nula es un valor puntual" - aunque en algunos casos escribimos la hipótesis nula como si fuera un punto, cuando en realidad es compuesta. Me pregunto qué implicaciones tiene el argumento en tu primer párrafo para las pruebas unilaterales. (Dado que no escribimos -que yo sepa- "aceptar $H_0$" incluso para pruebas unilaterales, no estoy seguro de que el primer párrafo capture la verdadera razón por la que no escribimos "aceptar $H_0$).

1 votos

@Silverfish, el párrafo termina con: "una hipótesis nula tradicional punto no se puede probar". Sin embargo, tampoco escribimos "aceptar $H_0$" para pruebas de un solo lado por la misma razón. Cuando $H_0: \delta\le 0$, el verdadero $\delta$ puede ser $>0$, pero arbitrariamente cercano y por lo tanto no significativo. Si realmente quisieras mostrar que era $<0$, entonces puedes cambiar la dirección de la prueba de un solo lado. No veo ningún problema aquí.

1 votos

No estoy diciendo que lo que escribiste está mal y sospechaba que esa era la idea que estabas tratando de comunicar. Obviamente, la razón por la que has abordado la prueba de dos lados con una hipótesis puntual en los dos primeros párrafos de tu respuesta es que este es el caso en cuestión. Pero si alguien vuelve a leer tu respuesta preguntándose por qué no "aceptamos $H_0$" en general, puede que no les resulte claro que tu argumento realmente se extiende más allá de hipótesis nulas puntuales.

33voto

Eero Puntos 1612

Consideremos el caso en el que la hipótesis nula es que una moneda tiene 2 caras, es decir, la probabilidad de obtener cara es 1. Ahora los datos son el resultado de lanzar una moneda una sola vez y ver una cara. Esto resulta en un valor p de 1.0 que es mayor que cualquier alfa razonable. ¿Significa esto que la moneda tiene 2 caras? Podría ser, pero también podría ser una moneda justa y vimos cara debido a la casualidad (sucedería el 50% del tiempo con una moneda justa). Entonces, el alto valor p en este caso dice que los datos observados son perfectamente coherentes con la hipótesis nula, pero también son coherentes con otras posibilidades.

Así como un veredicto de "No culpable" en el tribunal puede significar que el acusado es inocente, también puede ser porque el acusado es culpable pero no hay suficiente evidencia. Lo mismo ocurre con la hipótesis nula que no rechazamos porque la hipótesis nula podría ser cierta, o podría ser que no tenemos suficiente evidencia para rechazarla aunque sea falsa.

5 votos

Me gusta el ejemplo de "No culpable". Yendo un paso más allá, la reapertura de casos basada en evidencia de ADN que no sabíamos cómo usar en el pasado y que ha llevado a anulación de algunas condenas es un ejemplo perfecto de cómo agregar más datos puede ser todo lo que se necesita para tener suficiente evidencia.

7voto

cyborg Puntos 214

La ausencia de evidencia no es evidencia de ausencia (el título de un artículo de Altman, Bland en BMJ). Los valores P solo nos dan evidencia de ausencia cuando los consideramos significativos. De lo contrario, no nos dicen nada. Por lo tanto, ausencia de evidencia. En otras palabras: no sabemos y más datos pueden ayudar.

10 votos

Suspiro... una vez más veo esta cita siendo mencionada y una vez más debo señalar que es una afirmación falsa. la ausencia de evidencia no es prueba de ausencia. Sin embargo, es evidencia de ausencia. Piensa - si ingiero una nueva sustancia podría ser venenosa. Después de hacerlo una vez y no encontrar efectos secundarios - tengo evidencia de la ausencia de veneno, a partir de la ausencia de un efecto en los datos que observé. Pero no es una prueba (quizás tuve suerte), para esto se requeriría más datos, como dices.

0 votos

Un test de hipótesis correctamente alimentado que no rechaza la hipótesis nula es absolutamente evidencia de ausencia. Un poder suficiente significa que probablemente habrías rechazado la hipótesis nula si de hecho fuera falsa, el hecho de que no lo hicieras implica que no es falsa. Esta respuesta sugiere que si revisas para ver si hay un elefante en tu armario y no ves ninguno, no es evidencia de que tu armario esté libre de elefantes.

5voto

SomeEE Puntos 646

La hipótesis nula, $H_0$, suele ser considerada como la suposición que tienes razones para asumir. A menudo es el "estado actual del conocimiento" que deseas demostrar que es estadísticamente improbable.

La configuración habitual para la prueba de hipótesis es minimizar el error de Tipo I, es decir, minimizar la posibilidad de rechazar la hipótesis nula a favor de la alternativa $H_1$ incluso cuando $H_0$ es verdadero. Este es el error que elegimos minimizar primero porque no queremos revertir el conocimiento común cuando ese conocimiento común es realmente verdadero.

Siempre debes diseñar tu prueba teniendo en cuenta que $H_0$ debería ser lo que esperas.

Si tenemos dos muestras que esperamos que estén distribuidas de manera idéntica, entonces nuestra hipótesis nula es que las muestras son iguales. Si tenemos dos muestras que esperaríamos que sean (muy) diferentes, nuestra hipótesis nula es que son diferentes.

0 votos

Y qué pasa si no tenemos expectativas.. podría ser que simplemente no sepamos. Además, ¿cómo funcionará la regla de decisión si queremos rechazar la hipótesis de que las dos muestras son diferentes?

0 votos

En el caso de que no tengas expectativas, quieres mantener ambos tipos de errores pequeños, pero esto no siempre es posible. Necesitas una variable adicional (como aumentar el tamaño de la muestra) para lograrlo.

3 votos

Dado que podemos rechazar la hipótesis nula pero no demostrar su veracidad, generalmente la hipótesis nula es lo contrario de lo que queremos probar o asumir como verdadero. Si creemos que existe una diferencia, entonces la hipótesis nula debería ser que no hay diferencia, para que puedas desmentirlo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X