"A grandes rasgos, el valor p da una probabilidad del resultado observado de un experimento dada la hipótesis (modelo)".
pero no lo hace. Ni siquiera a grandes rasgos: esto falsea una distinción esencial.
El modelo no está especificado, como señala Raskolnikov, pero supongamos que se refiere a un modelo binomial (lanzamientos de moneda independientes, sesgo de moneda desconocido fijo). La hipótesis es la afirmación de que el parámetro relevante en este modelo, el sesgo o probabilidad de salir cara, es 0,5.
"Teniendo esta probabilidad (valor p) queremos juzgar nuestra hipótesis (cuán probable es)"
Es posible que queramos hacer este juicio, pero un valor p no nos ayudará (ni fue diseñado para hacerlo).
"¿Pero no sería más natural calcular la probabilidad de la hipótesis dado el resultado observado?"
Tal vez sí. Véase toda la discusión sobre Bayes más arriba.
"[...] Ahora calculamos el valor p, que es igual a la probabilidad de obtener 14 o más caras en 20 lanzamientos de la moneda. Bien, ahora tenemos esta probabilidad (0,058) y queremos usar esta probabilidad para juzgar nuestro modelo (cómo es de probable que tengamos una moneda justa)."
de nuestra hipótesis, suponiendo que nuestro modelo sea verdadero", pero esencialmente: sí. Los valores p grandes indican que el comportamiento de la moneda es coherente con la hipótesis de que es justa. (También suelen ser consistentes con que la hipótesis sea falsa pero esté tan cerca de ser cierta que no tengamos suficientes datos para saberlo; véase 'poder estadístico').
"Pero si queremos estimar la probabilidad del modelo, ¿por qué no calculamos la probabilidad del modelo dado el experimento? ¿Por qué calculamos la probabilidad del experimento dado el modelo (valor p)?"
En realidad, no calculamos la probabilidad de los resultados experimentales dada la hipótesis en esta configuración. Al fin y al cabo, la probabilidad es sólo de 0,176 de ver exactamente 10 cabezas cuando la hipótesis es cierta, y esa es la más valor probable. Esta no es una cantidad de interés en absoluto.
También es relevante que tampoco solemos estimar la probabilidad del modelo. Tanto las respuestas frecuentistas como las bayesianas suelen asumir que el modelo es verdadero y hacen sus inferencias sobre sus parámetros. De hecho, no todos los bayesianos sería incluso, en principio, interesarse por la probabilidad del modelo, es decir: la probabilidad de que toda la situación estuviera bien modelada por una distribución binomial. Puede que hagan mucha comprobación del modelo, pero nunca se preguntan realmente qué probabilidad tiene la binomial en el espacio de otros modelos posibles. Los bayesianos que se preocupan por los factores de Bayes están interesados, otros no tanto.
0 votos
Todavía tendría que modelar su experimento de alguna manera para poder calcular la función de probabilidad.
12 votos
Pete Dixon escribió un artículo en 1998 titulado "Why scientists value p-values" ( psychonomic.org/backissues/1631/R382.pdf ) que podría ser una lectura informativa. Una buena continuación sería el artículo de Glover y Dixon de 2004 sobre el cociente de probabilidad como métrica de sustitución ( pbr.psychonomic-journals.org/content/11/5/791.full.pdf ).
3 votos
Mike, eso me parece sospechosamente una buena respuesta. ¿Qué hace en los comentarios?
0 votos
John D. Cook publicó una excelente respuesta a una pregunta mía, que creo que le resultará interesante: stats.stackexchange.com/questions/1164/
0 votos
La gente no utiliza los valores p, los estadísticos sí. (No he podido resistirme a un dicho enjundioso que también es cierto. Por supuesto, una vez que empiezas a calificar adecuadamente cada sustantivo, pierde su contundencia).
0 votos
Exactamente tu ejemplo (la distribución de Bernoulli) se describe en la Wikipedia con palabras sencillas (comparando con otras respuestas en este tema): Factores de Bayes
0 votos
Los enlaces anteriores a Dixon 1998 y Glover & Dixon 2004 se han estropeado. las urls de las páginas web de las revistas son link.springer.com/article/10.3758/BF03196706 y link.springer.com/article/10.3758/BF03208815
0 votos
Los valores P son menos aplicables de lo que se da a entender en el post original porque el post es incorrecto al decir que son probabilidades de los resultados experimentales dada una hipótesis. En cambio, son probabilidades de un más impresionante resultado experimental que el realmente obtenido, dada una hipótesis.