Ya que se puede calcular los intervalos de confianza para los valores de p y desde el frente de intervalo de estimación es el punto de estimación: Es el valor p de una estimación de punto?
Respuestas
¿Demasiados anuncios?Las estimaciones puntuales y los intervalos de confianza son para los parámetros que describen la distribución, por ejemplo, media o la desviación estándar.
Pero a diferencia de otras estadísticas como la media muestral y la desviación estándar de la muestra el p-valor no es una útil calculadora de un interesante parámetro de distribución. Mira la respuesta de @whuber para conocer los detalles técnicos.
El valor p para una prueba estadística da la probabilidad de observar una desviación del valor esperado de la prueba estadística como mínimo tan grande como la observada en la muestra, calculada bajo el supuesto de que la hipótesis nula es verdadera. Si tienes toda la distribución es consistente con la hipótesis nula, o no lo es. Esto puede ser descrito con indicador de variable (de nuevo, ver la respuesta de @whuber).
Pero el valor de p no puede ser utilizado como un útil estimador de la variable de indicador debido a que no es tan consistente como el p-valor no convergen como el tamaño de la muestra aumenta si la hipótesis nula es verdadera. Esto es un poco complicado forma alternativa de afirmar que una prueba estadística puede rechazar o no rechazar la nula, pero nunca lo confirman.
Sí, podría ser (y ha sido) argumentó que un p-valor es una estimación de punto.
Con el fin de identificar cualquier propiedad de una distribución de un p-valor podría estimar, tendríamos que asumir que es asintóticamente insesgados. Pero, asintóticamente, la media del valor de p para la hipótesis nula es de $1/2$ (idealmente; para algunas pruebas podría ser algún otro número distinto de cero) y para cualquier otra hipótesis es $0$. Por lo tanto, el p-valor podría ser considerado como un estimador de la mitad de la función de indicador de la hipótesis nula.
Es cierto que se necesita un poco de creatividad a la vista de un valor-p de esta manera. Podríamos hacer un poco mejor al ver el perito en cuestión la decisión que tomamos por medio de la p-valor: es la distribución subyacente de un miembro de la hipótesis nula o de la hipótesis alternativa? Vamos a llamar a este conjunto de decisiones posibles $D$. Jack Kiefer escribe
Suponemos que no es un experimento cuyo resultado el estadístico puede observar. Este resultado es descrito por una variable aleatoria o al azar vector de $X$ ... . La probabilidad de ley de $X$ es desconocido para el estadístico, pero se sabe que la distribución de la función $F$ de $X$ es un miembro de una clase especificada $\Omega$ de funciones de distribución. ...
Un problema estadístico se dice que es un problema de punto de estimación de si $D$ es el conjunto de valores posibles de ciertos bienes o valores de vectores de la propiedad de $F$, que depende de $F$ en un razonablemente suave.
En este caso, porque $D$ es discreto, "liso" no es una restricción. Kiefer terminología refleja esta haciendo referencia a procedimientos estadísticos con discretos espacios de decisión como "pruebas" en lugar de "punto de estimadores."
Aunque es interesante explorar los límites (y limitaciones) de tales definiciones, como esta pregunta nos invita a hacer, quizá no deberíamos insistir firmemente que un valor-p es un punto de estimador, ya que esta distinción entre los peritos y de las pruebas es a la vez útil y convencional.
En un comentario a esta pregunta, Christian Robert llamó la atención a un 1992 papel donde él y co-autores tomaron exactamente este punto de vista y analizada la admisibilidad de la p-valor como un estimador de la función de indicador. Vea el enlace en las referencias. El documento comienza,
Enfoques para la prueba de hipótesis, generalmente han tratado el problema de las pruebas de toma de decisión en lugar de la estimación. Más precisamente, una formal de la prueba de hipótesis, el resultado será una conclusión en cuanto a si una hipótesis es verdadera, y no proporcionan una medida de la evidencia para asociar con esa conclusión. En este trabajo consideramos que la prueba de hipótesis como un problema de estimación dentro de la decisión-marco teórico de ... .
[Énfasis añadido.]
Referencias
Jiunn Tzon Hwang, Jorge Casella, Christian Robert, Martin T. Wells, y Roger H. Farrell, la Estimación de la Precisión en las Pruebas. Ann. Estatismo. Volumen 20, Número 1 (1992), 490-509. El acceso abierto.
Jack Carl Kiefer, Introducción a la Inferencia Estadística. Springer-Verlag, 1987.
$p$-valores no son utilizados para la estimación de un parámetro de interés, pero para la prueba de hipótesis. Por ejemplo, usted podría estar interesado en estimar la población $\mu$ basa en el ejemplo que usted tiene, o usted podría estar interesado en el intervalo de estimación de ella, pero en la prueba de hipótesis escenario prefiere comparar la media de la muestra de $\overline x$ media de la población es de $\mu$ a ver si difieren. De hecho, en la prueba de hipótesis escenario usted no interesados en sus valores particulares, sino más bien si están por debajo de un cierto umbral (por ejemplo, $p < 0.05$). Con $p$-valores que no son muy interesada en sus valores de punto, pero en su lugar desea saber si los datos proporcionan suficiente evidencia contra la hipótesis nula. En la prueba de hipótesis escenario, no sería la comparación de los diferentes $p$-valores para cada uno de los otros, sino más bien el uso de cada uno de ellos para tomar las decisiones acerca de su hipótesis. Usted realmente no quiere saber nada sobre el casco de la hipótesis, como ustedes saben, si usted puede rechazar o no. Esto hace que sus valores inseparable de la decisión de contexto y por lo que difieren de las estimaciones puntuales, porque con las estimaciones puntuales estamos interesados en sus valores per se.