Hay dos intentos de hacer exactamente lo que has dicho en la historia de la estadística, el bayesiano y el fiducial. R. A. Fisher fundó dos escuelas de pensamiento estadístico, la escuela likelihoodista construida en torno al método de máxima verosimilitud y la fiducial, que acabó en fracaso pero que intenta hacer exactamente lo que tú quieres.
La respuesta breve a por qué fracasó es que sus distribuciones de probabilidad no acabaron integrándose en la unidad. La lección, al final, fue que la probabilidad a priori es algo necesario para crear lo que intentas crear. De hecho, vas por el camino de uno de los más grandes estadísticos de la historia y más de unos cuantos de los otros grandes murieron esperando una resolución a este problema. Si se encontrara, los métodos de hipótesis nula se equipararían a los métodos bayesianos en cuanto al tipo de problemas que podrían resolver. De hecho, superaría a Bayes, salvo en los casos en que existiera información a priori real.
También debe tener cuidado con su afirmación de que un valor p indica una mayor probabilidad para la alternativa. Eso sólo es cierto en la escuela probabilística de Fisher. No es cierto en absoluto en la escuela frecuentista de Pearson-Neyman. Su apuesta en la parte inferior parece ser una apuesta Pearson-Neyman, mientras que su valor p es incompatible, ya que proviene de la escuela de Fisher.
Para ser caritativo, voy a suponer que, para su ejemplo, no hay sesgo de publicación y, por tanto, sólo los resultados significativos aparecen en las revistas, lo que crea una alta tasa de falsos descubrimientos. Estoy tratando esto como una muestra aleatoria de todos los estudios realizados, independientemente de los resultados. Yo diría que sus apuestas no serían coherentes en el sentido clásico de la palabra de Finetti.
En el mundo de De Finetti, una apuesta es coherente si el corredor de apuestas no puede ser engañado por los jugadores para que se enfrenten a una pérdida segura. En su construcción más simple, es como la solución al problema de cortar la tarta. Una persona corta el trozo por la mitad, pero la otra elige qué trozo quiere. En esta construcción, una persona indicaría los precios de las apuestas en cada hipótesis, pero la otra persona elegiría comprar o vender la apuesta. En esencia, se podría vender al descubierto la nula. Para ser óptimas, las probabilidades tendrían que ser estrictamente justas. Los valores P no conducen a probabilidades justas.
Para ilustrarlo, consideremos el estudio de Wetzels, et al en http://ejwagenmakers.com/2011/WetzelsEtAl2011_855.pdf
cuya cita es: Ruud Wetzels, Dora Matzke, Michael D. Lee, Jeffrey N. Rounder, Geoffrey J. Iverson y Eric-Jan Wagenmakers. Statistical Evidence in Experimental Psychology: An Empirical Comparison Using 855 t Tests. Perspectivas de la ciencia psicológica. 6(3) 291-298. 2011
Se trata de una comparación directa de 855 pruebas t publicadas que utilizan factores de Bayes para eludir el problema de la distribución a priori. En el 70% de los valores p entre 0,05 y 0,01, los factores de Bayes eran, en el mejor de los casos, anecdóticos. Esto se debe a la forma matemática utilizada por los frecuentistas para resolver el problema.
Los métodos de hipótesis nula presuponen que el modelo es verdadero y, por su construcción, utilizan una distribución estadística minimax en lugar de una distribución de probabilidad. Ambos factores influyen en las diferencias entre las soluciones bayesianas y no bayesianas. Consideremos un estudio en el que el método bayesiano evalúa la probabilidad posterior de una hipótesis en un tres por ciento. Imaginemos que el valor p es inferior al cinco por ciento. Ambas cosas son ciertas, ya que el tres por ciento es menos del cinco por ciento. Sin embargo, el valor p no es una probabilidad. Sólo indica el valor máximo que podría ser la probabilidad de ver los datos, no la probabilidad real de que una hipótesis sea verdadera o falsa. De hecho, según la construcción del valor p, no se puede distinguir entre efectos debidos al azar con un nulo verdadero y un nulo falso con datos buenos.
Si examina el estudio de Wetzel, observará que es muy obvio que las probabilidades implícitas en los valores p no coinciden con las probabilidades implícitas en la medida bayesiana. Dado que la medida bayesiana es admisible y coherente, y la no bayesiana no es coherente, no es seguro suponer que los valores p corresponden a las probabilidades reales. La suposición forzada de que el nulo es válido proporciona buenas probabilidades de cobertura, pero no produce buenas probabilidades de juego.
Para entender mejor por qué, consideremos el primer axioma de Cox, según el cual la verosimilitud de una hipótesis puede describirse mediante un número real. Implícitamente, esto significa que todas las hipótesis tienen un número real ligado a su verosimilitud. En los métodos de hipótesis nula, sólo la hipótesis nula tiene un número real ligado a su verosimilitud. La hipótesis alternativa no tiene medida y, desde luego, no es el complemento de la probabilidad de observar los datos dado que la nula es cierta. De hecho, si la nula es verdadera, entonces el complemento es falso por suposición sin tener en cuenta los datos.
Si construyera las probabilidades utilizando valores p como base de su medición, entonces el bayesiano que utilizara mediciones bayesianas siempre sería capaz de obtener una ventaja sobre usted. Si el bayesiano estableciera las probabilidades, entonces la teoría de la decisión de Pearson y Neyman proporcionaría una declaración de apostar o no apostar, pero no podrían definir la cantidad a apostar. Como las probabilidades bayesianas eran justas, la ganancia esperada de utilizar el método de Pearson y Neyman sería cero.
De hecho, el estudio Wetzel es realmente lo que usted está hablando de hacer, pero con 145 apuestas menos. Si miras la tabla tres verás algunos estudios en los que el frecuentista rechaza la nula, pero el bayesiano encuentra que la probabilidad favorece la nula.
0 votos
Véase, por ejemplo: math.tut.fi/~piche/bayes/notes06.pdf
0 votos
Aunque esto podría acabar siendo más un debate que una sesión de preguntas y respuestas, la pregunta me parece muy interesante: una explicación de este aspecto de los valores p podría ser muy esclarecedora. Tengo una observación: en su definición del valor p en cursiva se refiere a una "muestra tan extrema como ésta", cuando creo que debería referirse a la test-estadístico (con todos sus supuestos), en los datos que has recogido para reflejar mejor las condiciones adicionales que se aplican a su valor p. Lamentablemente, no estoy seguro de que este añadido responda a su pregunta...
0 votos
Véase stats.stackexchange.com/questions/166323/
13 votos
"Qué información nos falta": la probabilidad a priori de que H0 sea cierta. No es más que el teorema de Bayes: para calcular la probabilidad posterior, hay que tener una probabilidad a priori.
0 votos
Si estamos expresando los resultados de nuestro estudio y nada más, ¿no implica eso una prioridad de 0,5? Por ejemplo, ¿pretendemos que ambas hipótesis son igual de probables, luego miramos los datos y vemos qué hipótesis es ahora más probable?
0 votos
@amoeba Según la regla de Cromwell, necesitaríamos una probabilidad posterior de 1 para conocer algo como verdad en lugar de sólo un alto grado de creencia. ¿Puede una razón de verosimilitud dominar alguna vez una probabilidad a priori con una muestra finita?
1 votos
@AdamO No veo cómo se deduce eso de la regla de Cromwell, que se refiere a lo anterior, no a lo posterior. Creo que puedes estar confundiendo "verdad" con "conocimiento cierto". Si estuviéramos interesados en el conocimiento cierto, estaríamos utilizando la lógica, en lugar del razonamiento probabilístico.
1 votos
@AdamO No te sigo. El OP preguntaba "¿Qué información nos falta que nos restringe derivar la probabilidad de que la hipótesis sea cierta a partir del valor p y los datos relacionados?" ¿Qué tiene que ver la probabilidad 1 y saber algo como verdad?
1 votos
En respuesta a tu comentario anterior @Atte: bueno, si uno quiere asumir una prioridad de 0,5 entonces bien, pero no veo por qué esto debería ser siempre una suposición significativa. En cualquier caso, es una suposición.