26 votos

Ziliak (2011) se opone al uso de valores p y menciona algunas alternativas; ¿cuáles son?

En un artículo reciente en el que se discuten las desventajas de basarse en el valor p para la inferencia estadística, llamado "Matrixx contra Siracusano y Student contra Fisher La significación estadística a juicio" (DOI: 10.1111/j.1740-9713.2011.00511.x), Stephen T. Ziliak se opone al uso de valores p. En los párrafos finales dice:

Los datos son lo único que ya sabemos, y con certeza. Lo que en realidad queremos saber es algo muy distinto: la probabilidad de que una hipótesis sea cierta (o al menos prácticamente útil), dados los datos que tenemos. Queremos saber la probabilidad de que las dos drogas sean diferentes, y en qué medida, dadas las pruebas disponibles. disponibles. La prueba de significación, basada en la falacia de la falacia del condicional transpuesto, la trampa en la que cayó Fisher. no puede decirnos esa probabilidad. La función de potencia, la esperada, y muchos otros métodos bayesianos y de teoría de la decisión descendientes de Student y Jeffreys, ahora ampliamente disponibles y gratuitos en línea.

¿Qué es la función de potencia, la función de pérdida esperada y "otros métodos teóricos de decisión y bayesianos"? ¿Se utilizan ampliamente estos métodos? ¿Están disponibles en R? ¿Cómo se aplican los nuevos métodos propuestos? Por ejemplo, ¿cómo utilizaría estos métodos para probar mi hipótesis en un conjunto de datos en el que, de otro modo, utilizaría pruebas t de dos muestras y valores p convencionales?

18voto

Tao Zhyn Puntos 1036

Esto parece otro artículo estridente de un individuo confundido. Fisher no cayó en tal trampa, aunque muchos estudiantes de estadística sí lo hacen.

La comprobación de hipótesis es un problema de teoría de la decisión. Por lo general, se llega a una prueba con un umbral determinado entre las dos decisiones (hipótesis verdadera o hipótesis falsa). Si tiene una hipótesis que corresponde a un único punto, como por ejemplo $\theta=0$ entonces puedes calcular la probabilidad de que tus datos resulten cuando es verdad. Pero, ¿qué hacer si no es un único punto? Obtienes una función de $\theta$ . La hipótesis $\theta\not= 0$ es tal hipótesis, y obtienes tal función para la probabilidad de producir tus datos observados dado que es cierta. Esa función es la función de potencia. Es muy clásica. Fisher sabía todo sobre ella.

La pérdida esperada forma parte de la maquinaria básica de la teoría de la decisión. Tenemos varios estados de la naturaleza, varios datos posibles resultantes de ellos y algunas decisiones posibles que podemos tomar, y queremos encontrar una buena función de los datos a la decisión. ¿Cómo se define "buena"? Dado un determinado estado de la naturaleza que subyace a los datos que has obtenido, y la decisión tomada por ese procedimiento, ¿cuál es tu pérdida esperada? Esto se entiende de forma más sencilla en los problemas empresariales (si hago esto basándome en las ventas que he observado en los últimos tres trimestres, ¿cuál es la pérdida monetaria esperada?)

Los procedimientos bayesianos son un subconjunto de los procedimientos de la teoría de la decisión. La pérdida esperada es insuficiente para especificar de forma única los mejores procedimientos en todos los casos salvo en los triviales. Si un procedimiento es mejor que otro tanto en el estado A como en el B, obviamente lo preferirá, pero si uno es mejor en el estado A y otro en el B, ¿cuál elige? Aquí es donde entran en juego ideas auxiliares como los procedimientos de Bayes, la minimaxidad y la insesgadez.

En realidad, la prueba t es una solución perfecta a un problema de teoría de la decisión. La cuestión es cómo elegir el punto de corte en el $t$ calcula. Un valor dado de $t$ corresponde a un valor determinado de $\alpha$ la probabilidad de error de tipo I, y a un conjunto dado de potencias $\beta$ dependiendo del tamaño del parámetro subyacente que se esté estimando. ¿Es una aproximación utilizar una hipótesis nula puntual? Sí. ¿Suele ser un problema en la práctica? No, igual que utilizar la teoría aproximada de Bernoulli para la desviación de una viga suele estar bien en ingeniería estructural. ¿Tener la $p$ -¿valor inútil? No. Otra persona que consulte sus datos puede querer utilizar un valor diferente. $\alpha$ que tú, y el $p$ -valor se adapta a ese uso.

También me confunde un poco por qué nombra juntos a Student y Jeffreys, teniendo en cuenta que Fisher fue el responsable de la amplia difusión de la obra de Student.

Básicamente, el uso ciego de los valores p es una mala idea, y son un concepto bastante sutil, pero eso no los hace inútiles. ¿Debemos oponernos a su uso indebido por parte de investigadores con escasa formación matemática? Por supuesto, pero recordemos cómo era antes de Fisher intentó destilar algo para que el hombre de campo pudiera utilizarlo.

6voto

georg Puntos 1742

Recomiendo centrarse en aspectos como los intervalos de confianza y la comprobación de modelos. Andrew Gelman ha hecho un gran trabajo al respecto. Recomiendo sus libros de texto, pero también echa un vistazo a las cosas que ha puesto en línea, por ejemplo. http://andrewgelman.com/2011/06/the_holes_in_my/

5voto

Matt Mitchell Puntos 17005

En ez proporciona cocientes de probabilidad cuando se utiliza la función ezMixed() para realizar modelos de efectos mixtos. Los cocientes de probabilidad pretenden cuantificar la evidencia de un fenómeno comparando la probabilidad (dados los datos observados) de dos modelos: un modelo "restringido" que restringe la influencia del fenómeno a cero y un modelo "no restringido" que permite una influencia distinta de cero del fenómeno. Tras corregir las probabilidades observadas para tener en cuenta la complejidad diferencial de los modelos (mediante el criterio de información de Akaike, que es asintóticamente equivalente a la validación cruzada), el cociente cuantifica la evidencia del fenómeno.

4voto

Eero Puntos 1612

Todas esas técnicas están disponibles en R en el mismo sentido que todo el álgebra está disponible en tu lápiz. Incluso los valores p están disponibles a través de muchas muchas funciones diferentes en R, decidir qué función utilizar para obtener un valor p o un posterior bayesiano es más complejo que un puntero a una sola función o paquete.

Una vez que conozcas estas técnicas y decidas qué pregunta quieres responder, podrás ver (o nosotros te ayudaremos) cómo hacerlo utilizando R (u otras herramientas). Decir simplemente que quieres minimizar tu función de pérdida u obtener una distribución posterior es tan útil como responder "comida" cuando te preguntan qué quieres cenar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X