10 votos

¿Cómo se formaliza una distribución de probabilidad a priori? ¿Existen reglas generales o consejos que se deban utilizar?

Aunque me gusta pensar que comprendo bien el concepto de información previa en el análisis estadístico bayesiano y la toma de decisiones, a menudo me cuesta entender su aplicación. Tengo en mente un par de situaciones que ejemplifican mis dificultades, y creo que no se abordan adecuadamente en los libros de texto de estadística bayesiana que he leído hasta ahora:

Supongamos que hace unos años realicé una encuesta que dice que el 68% de las personas estarían interesadas en comprar un producto ACME. Decido realizar la encuesta de nuevo. Aunque utilizaré el mismo tamaño de muestra que la última vez (digamos, n=400), es probable que las opiniones de la gente hayan cambiado desde entonces. Sin embargo, si utilizo como prior una distribución beta en la que 272 de 400 encuestados respondieron "sí", estaría dando el mismo peso a la encuesta que realicé hace unos años y a la que realizaría ahora. ¿Existe alguna regla general para establecer la mayor incertidumbre que me gustaría poner en la priorización en virtud de que esos datos son de hace unos años? Entiendo que puedo reducir la prioridad de 272/400 a, digamos, 136/200, pero esto parece extremadamente arbitrario, y me pregunto si hay algún tipo de justificación, quizás en la literatura, que respalde la elección de la prioridad.

Para otro ejemplo, digamos que estamos a punto de realizar un ensayo clínico. Antes de iniciar el ensayo, realizamos algunas investigaciones secundarias que podríamos utilizar como información previa, incluyendo opiniones de expertos, resultados de ensayos clínicos anteriores (de relevancia variable), otros hechos científicos básicos, etc. ¿Cómo se puede combinar ese espectro de información (parte de la cual no es de naturaleza cuantitativa) con una distribución de probabilidad a priori? ¿Se trata simplemente de tomar una decisión sobre qué familia escoger y hacerla lo suficientemente difusa como para garantizar que se vea abrumada por los datos, o hay que trabajar mucho para establecer una distribución previa bastante informativa?

1 votos

4voto

Christoph Hanck Puntos 4143

Su idea de tratar su información previa de 272 éxitos en 400 intentos tiene una justificación bayesiana bastante sólida.

El problema que se plantea, como ha reconocido, es el de estimar una probabilidad de éxito $\theta$ de un experimento Bernoulli. La distribución Beta es la correspondiente "prioridad conjugada". Estas priorizaciones conjugadas gozan de la "interpretación de muestra ficticia":

La prioridad Beta es $$ \pi(\theta)=\frac{\Gamma(\alpha_0+\beta_0)}{\Gamma(\alpha_0)\Gamma(\beta_0)}\theta^{\alpha_0-1}(1-\theta)^{\beta_0-1} $$ Esto puede interpretarse como la información contenida en una muestra de tamaño $\underline{n}=\alpha_0+\beta_0-2$ (de forma imprecisa, ya que $\underline{n}$ no tiene por qué ser entero, por supuesto) con $\alpha_0-1$ éxitos: $$ \pi(\theta)=\frac{\Gamma(\alpha_0+\beta_0)}{\Gamma(\alpha_0)\Gamma(\beta_0)}\theta^{\alpha_0-1}(1-\theta)^{\underline{n}-(\alpha_0-1)} $$ Por lo tanto, si usted toma $\alpha_0+\beta_0-2=400$ y $\alpha_0-1=272$ Esto corresponde a los parámetros previos $\alpha_0=273$ y $\beta_0=129$ . "Reducir a la mitad" la muestra llevaría a parámetros previos $\alpha_0=137$ y $\beta_0=65$ . Ahora, recordemos que la media y la varianza a priori de la distribución beta vienen dadas por $$ \mu=\frac{\alpha}{\alpha+\beta}\qquad\text{and}\qquad\sigma^2=\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)} $$ Al reducir la muestra a la mitad se mantiene la media a priori (casi) donde está:

alpha01 <- 273
beta01 <- 129
(mean01 <- alpha01/(alpha01+beta01))

alpha02 <- 137
beta02 <- 65
(mean02 <- alpha02/(alpha02+beta02))

pero incrementa el desviación de

(priorvariance01 <- (alpha01*beta01)/((alpha01+beta01)^2*(alpha01+beta01+1)))
[1] 0.0005407484

a

(priorvariance02 <- (alpha02*beta02)/((alpha02+beta02)^2*(alpha02+beta02+1)))
[1] 0.001075066

como se desee.

0voto

JoanComasFdz Puntos 131

En teoría, una forma de principios ir sobre esto sería tener varias realizaciones de la cosa para el que desea una distribución previa y, a continuación, ajuste los parámetros para esta muestra. Pero sin que (aquí que bastante tienen una idea aproximada acerca de un valor) la elección de los parámetros sería algo arbitrario como usted señala. Incluso la decisión de utilizar la beta de la familia carece de cualquier justificación real fuera de la matemática conveniencia.

Un método para la contabilización de la incertidumbre general involucrado en el estado de la misma es el uso de los llamados vagos o poco informativo previo. Esta es una distribución que considera todos los valores como igualmente plausibles y aquí correspondería a un uniforme de$(0, 1)$ distribución. Pero entonces, básicamente, no utilizando la información previa a todos y no está claro por qué estás haciendo un análisis Bayesiano.

Creo que eres el encuentro con el problema que muchas personas tienen con la estadística Bayesiana, que es que por lo menos, parece subjetivo y arbitrario. Usted puede desear mirar en el área de meta-análisis para algunas otras ideas sobre la agregación de los datos de varios estudios. Probablemente no sea la más satisfactoria respuesta a su pregunta, pero esperemos que ayuda a algunos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X