8 votos

¿Por qué la PDF de la distribución de Dirichlet no parece integrarse en 1?

He estado intentando encontrar el valor esperado de una función de una variable aleatoria con una distribución Dirichlet integrando su producto con la función de densidad Dirichlet sobre un simplex en R.

Para comprobar que estaba aplicando la función correcta en R, probé a integrar la función de densidad sobre todo el simplex, esperando obtener 1, sin embargo seguía obteniendo que la función de densidad para una distribución Dirichlet con n categorías se integraba a sqrt(n) (usando el paquete R SimplicialCubature).

Supuse que esto debía estar mal, pero luego miré la función de densidad para 2 categorías, considere el caso en el que las alfas = (1,1). Entonces la función de densidad es uniformemente 1 (tomando la función de densidad de https://en.wikipedia.org/wiki/Dirichlet_distribution ). Así que la integral de la función de densidad sobre el 1-simplex sólo da la longitud del 1-simplex. Pero esto es sqrt(2), como he encontrado con el código R.

¿Qué me estoy perdiendo aquí?

12voto

Con dos variables, está definiendo un segmento de línea en $\mathbb{R}^2$ como usted ha señalado. Sin embargo, debido a la restricción simplex, una de estas dos variables es redundante en cuanto a la especificación de la densidad, ya que existe una relación uno a uno entre $x_1$ y $x_2$ . Por lo tanto, la densidad se especifica sobre $K-1$ variables libres (es decir, en $\mathbb{R}$ )

De hecho, esto se señala en la primera línea de esta sección del artículo de Wikipedia, aunque muy sutilmente.

Por lo tanto, su función de densidad se convierte en:.

$$Dir_{1,1}(x_1,1-x_1)=\frac{\Gamma(2)}{\Gamma(1)^2}(x_1)^0(1-x_1)^0=1$$

Por lo tanto,

$$\int_0^1 Dir_{1,1}(x_1,1-x_1) dx_1 = 1$$


Respuesta al comentario de la OP

Debido a las restricciones del simplex, la densidad de Dirichlet de dos variables es en realidad degenerado en $\mathbb{R}^2$ como muestra mi construcción anterior (sólo requiere una variable). Si bien es cierto que tiene una densidad de $1$ no tiene una densidad de $1$ en el segmento de línea que conecta $(1,0)$ con $(0,1)$ . Lo que la construcción anterior muestra es que el marginal tiene un valor de $1$ . Su confusión viene de pensar en $x_2$ como variable libre, en cuyo caso el soporte de la Dirichlet en $\mathbb{R}^2$ tendría un área no nula. Esta intuición está bien en casos como el de la gaussiana bivariante, donde las dos variables no están perfectamente correlacionadas, pero no en este caso.

Podemos derivar esto formalmente como sigue:

Dejemos que $L$ sea algún número en $[0,\sqrt{2}]$ especificando la distancia desde $(1,0)$ a $(0,1)$ a lo largo del segmento de línea de conexión. Así, cada valor de $L$ identifica un único $(x_ 1,x_2)$ par. Usando esta notación, su suposición de que la densidad es $1$ a lo largo de esta línea se reduce a:

$$P(L \in [a,b] \subset)=b-a$$

Sin embargo, podemos demostrar que no es así mediante un tratamiento formal de la densidad conjunta de $x_1,x_2$ :

$$P_L(L\in [a,b])=P_{X_1,X_2}[(x_1,x_2) \in A_{[a,b]}]$$

Donde $A_{[a,b]}:= \{(u,v): u \in [1-\frac{b}{\sqrt{2}},1-\frac{a}{\sqrt{2}}], v = 1- u]$

Ahora, vamos a calcular $P_L(L\in [a,b])$ :

$$P_L(L\in [a,b])= \int_{A_{[a,b]}} dP_{X_1,X_2}= \int_{A_{[a,b]}} dP_{X_1}dP_{X_2|X_1} =\int_{A_{[a,b]}} 1 \;dP_{X_1} = \int_{1-\frac{b}{\sqrt{2}}}^{1-\frac{a}{\sqrt{2}}}1\; du = $$

$$\left(1-\frac{a}{\sqrt{2}}\right) - \left(1-\frac{b}{\sqrt{2}}\right) = \frac{1}{\sqrt{2}}(b-a)$$

Donde la tercera igualdad se produce porque $dP_{X_2|X_1} = 1$ para $X_2=1-X_1$ (es decir, no es una densidad, sino una masa de probabilidad puntual en $1-X_1$ )

Como puede ver, hemos recuperado el $\frac{1}{\sqrt{2}}$ constante normalizadora de la densidad a lo largo del segmento de línea en $\mathbb{R}^2$ . En efecto, esta densidad conjunta (degenerada) no es más que una transformación lineal de uno de los dos marginales (cualquiera de ellos sirve). Esto hace que el dominio de la densidad de probabilidad vaya de $1$ a $\sqrt{2}$ por lo que la densidad debe disminuir para compensar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X