En Análisis bayesiano de datos En el capítulo 13, página 317, segundo párrafo completo, en las aproximaciones modales y distributivas, Gelman et al. escriben
Si el plan es resumir la inferencia por el modo posterior de $\rho$ [el parámetro de correlación en una distribución normal bivariada], nosotros sustituiríamos la distribución a priori U(-1,1) por $p(\rho) \propto (1 - \rho)(1 + \rho)$ , que equivale a una Beta(2,2) sobre el parámetro transformado $\frac{\rho + 1}{2}$ . La densidad previa y la resultante son cero en los límites y, por lo tanto, el modo posterior nunca será -1 o 1. Sin embargo,... la densidad a priori para $\rho$ es lineal cerca de los límites y, por lo tanto, no contradice ninguna probabilidad.
A continuación se muestra un gráfico de la PDF para la distribución Beta(2,2).
Aunque el gráfico se da para el dominio [0,1], la forma es la misma para el dominio [-1,1] obtenido al realizar la inversa de la transformación descrita en la cita anterior. Se trata de una distribución bastante informativa. Da unas siete veces la densidad a $\frac{\rho + 1}{2} = 0.5$ que a $\frac{\rho + 1}{2} = 0.3,0.97$ . Así que de hecho sería contradecir la probabilidad si la probabilidad apuntaba a algo lejos de los límites, pero aún más lejos de $\rho = 0$ . ¿No sería un mejor límite para evitar el previo Beta(1 + $\delta$ ,1 + $\delta$ ), donde $\delta \rightarrow 0$ . Tomemos, por ejemplo, Beta(1,0001, 1,0001), representada a continuación:
El problema con esta prioridad, por supuesto, es que la densidad cae muy bruscamente cerca de cero, lo que puede contradecir la probabilidad de que apunte a un espacio que está muy muy cerca de un límite. Lo que me lleva a mi pregunta:
¿Por qué no establecer la prioridad del parámetro de correlación transformado en Beta(1,1)? Porque la densidad de la distribución beta es cero para $\frac{\rho + 1}{2} = 0,1$ es equivalente a la distribución uniforme sobre el Abrir intervalo (-1,1) en lugar del intervalo cerrado [-1,1], por lo que no es una priorización que evita los límites, y no es preferible a una priorización que cree bastante en la probabilidad de que $\rho = 0$ ¿que sólo es deseable si realmente se tiene esa creencia?
En términos más generales, ¿el uso de la distribución beta no es por definición un límite que evita la prioridad porque su soporte es $0 < \frac{\rho + 1}{2} < 1$ ?