15 votos

¿Es importante el p=5.0%?

Hoy me preguntaron, si un valor de p de 0,05 (exactamente) se considera significativo (dado alfa=5%) o no. Yo no sé la respuesta y Google se presentó ambas respuestas: (a) el resultado es significativo si p es menor que 5% y (b) si p es menor que el 5% o igual a 5%.

Por supuesto, ninguno de estos sitios web citados a nadie. ¿Por qué debería uno - que es de conocimiento común y el 5% son arbitrarias, de todos modos. Pero eso no me ayuda a decirle a mis alumnos algo para recordar.

Así que, aquí están mis desesperadas preguntas sobre pruebas de hipótesis: Si el p-valor es exactamente el alfa - considero el resultado significativo o no? Y ¿cuál es la conserve su autoridad de citas en este caso?

Muchas gracias

19voto

AdamSane Puntos 1825

Dejando de lado algunas cuestiones prácticas (tales como la medida en que $\alpha$ es arbitrario, por ejemplo), las definiciones de nivel de significación y el valor p de que la respuesta a esta pregunta ambigua.

Es decir, formalmente, el rechazo de la regla es que usted rechazar al $p = \alpha$.

Lo que realmente debe sólo importa para el caso discreto, pero en esa situación, si no rechazar al $p=\alpha$, su tipo de tasa de error que en realidad no se $\alpha$!

(Como que a mí respecta no hay 'autorizado' citación; usted realmente necesita para conseguir a los apretones con el Neyman-Pearson y la Fisherian enfoques para la prueba de hipótesis, y es algo que se desarrollaron a lo largo del tiempo.)

Hay cualquier cantidad de buenas estadísticas, textos que describen la prueba de hipótesis correctamente.

La definición de la p-valor es dado correctamente en la primera frase de la correspondiente artículo de la Wikipedia*:

el p-valor es la probabilidad de obtener un estadístico de prueba de al menos tan extremo como el que realmente se ha observado, suponiendo que la hipótesis nula es verdadera.

*(y no, wikipedia no es una autoridad, sólo estoy diciendo que la definición es correcta)

Por simplicidad, vamos a ponerle punto nulos; sirve para conseguir el punto a través, sin enturbiar las aguas con problemas adicionales.

Ahora el nivel de significación, $\alpha$ es el tipo seleccionado de la tasa de error. Este es el tipo que usted elija la hipótesis nula se rechaza cuando es verdadera. Es decir, es la proporción de la hora de rechazar la nula. Ahora considere la posibilidad de un estadístico de prueba con una distribución discreta - la única vez que un $p$ de exactamente $\alpha$ es realmente posible**. (Que también suele ser el caso de que el alfa será diferente de algo bonito y redondo como el 5%.)

** Bueno, supongo que soy de confinamiento mi discusión puramente discretos o puramente continuo distribuidos de prueba-estadísticas. En el caso mixto, usted puede averiguar cómo mi discretos discusión se aplica en las situaciones en las que se aplica).

por ejemplo, considere una de dos colas prueba del signo con $n=17$, dicen. El más cercano alcanzable nivel de significación del 5% es 4.904%. Así que vamos a elegir a $\alpha = 4.904\%$ (o para ser más precisos, $\frac{137500}{2^{17}}$).

Así que cuando $H_0$ es cierto, ¿cuál es la tasa de rechazo si rechazamos al $p=\alpha$? Podemos trabajar. Es 4.904% - $\alpha$ elegimos.

Por otro lado, cuando se $H_0$ es cierto, ¿cuál es la tasa de rechazo si no rechazamos al $p=\alpha$? Podemos trabajar. Es solo 1,27%. Es la manera menos que $\alpha$. Esa no es la prueba de que nos apuntamos!

Es decir, nuestras pruebas (muy claramente!) tienen las propiedades deseadas si $p=\alpha$ está en la región de rechazo.

[Ahora vamos a considerar su situación. Es el p-valor en realidad, exactamente el 5%? Apuesto a que no se exactamente que, por varias razones diferentes. Pero en cualquier caso, se puede afirmar que, formalmente, $p=\alpha$ es un rechazo.]

Si usted describir su rechazo de la regla hasta el frente y demostrar que (si los supuestos son satisfechos), tiene el deseado nivel de significación, entonces probablemente no hay necesidad de referencias.

Un rechazo de la regla es simplemente una declaración acerca de que los valores de la prueba estadística de causa que usted rechazar $H_0$. Es equivalente a definir la región de rechazo (véase Casella y Berger, Inferencia Estadística, p346, que define el término de rechazo región en términos sencillos).

El mismo libro que define los valores de p (p364) en términos diferentes a la wikipedia (pero con el mismo significado resultante), que se define como (para un determinado conjunto de datos), el más pequeño $\alpha$ que podría conducir al rechazo de la nula.

(Si usted tiene una edición diferente los números de página pueden cambiar, pero tiene un índice, de modo que usted puede buscar términos; tenga cuidado, puede que tenga que buscar en los listados bajo "prueba de Hipótesis" o algo similar en el índice para encontrar el rechazo de la región')

Hmm, vamos a tratar de otro libro de la estantería. Wackerly, Mendenhall & Scheaffer Estadística Matemática con Aplicaciones, 5ª edición, define un rechazo a la región en p412 y un p-valor (mismo def C&B) en p431.

2voto

Zakaria Puntos 16

Una interesante confesión que había aprendido en mis principios de bioestadística de la clase de un profesor es que el nivel de significación de 0,05 fue más de lo que llegó a través de un consenso, en lugar de oro de verdad. Desde entonces, he visto literatura que coquetea con el nivel de significación de 0,05, tales como "se aproxima a" ser todavía un sorprendente hallazgo del estudio y he escuchado los argumentos de que el nivel de significación de 0,05 pueden no aplicarse a todos los campos de la investigación. Con eso dicho, me he encontrado con estimaciones puntuales e intervalos de confianza para ser más informativo que los niveles de significación. He aquí un interesante artículo sobre el tema (a mí de todos modos).

0voto

sun4e14 Puntos 21

El valor de p se suele establecer por consenso como se dijo anteriormente ( o más bien pereza). Para ser realmente capaces de decir que algo es importante, debemos encontrar el valor de p que corresponde al tamaño del efecto, el tamaño de la muestra, y cómo los estrictos requisitos que usted desea para su tipo de datos. Esto se llama análisis de la potencia (es un subcampo dentro de las estadísticas). Muchas personas no son conscientes o simplemente no lo uso porque no es sencillo. Esto no es para decir que está bien de la manera que es. Siempre debemos hacer un estudio de este tipo para sacar conclusiones que son realmente significativas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X