28 votos

Construcción de la distribución de Dirichlet con distribución Gamma

Permita que$X_1,\dots,X_{k+1}$ sean variables aleatorias mutuamente independientes, cada una de las cuales tenga una distribución gamma con los parámetros$\alpha_i,i=1,2,\dots,k+1$ que muestren que$Y_i=\frac{X_i}{X_1+\cdots+X_{k+1}},i=1,\dots,k$, tenga una distribución conjunta como$\text{Dirichlet}(\alpha_1,\alpha_2,\dots,\alpha_k;\alpha_{k+1})$

PDF conjunto de$(X_1,\dots,X_{k+1})=\frac{e^{-\sum_{i=1}^{k+1}x_i}x_1^{\alpha_1-1}\dots x_{k+1}^{\alpha_{k+1}-1}}{\Gamma(\alpha_1)\Gamma(\alpha_2)\dots \Gamma(\alpha_{k+1})}$. Luego, para encontrar un PDF conjunto de$(Y_1,\dots,Y_{k+1})$, no puedo encontrar jacobian, es decir,$J(\frac{x_1,\dots,x_{k+1}}{y_1,\dots,y_{k+1}})$

49voto

jldugger Puntos 7490

Jacobians--el absoluto determinantes del cambio de función de variable, parecen formidable y puede ser complicado. Sin embargo, son esenciales e inevitables parte del cálculo de un multivariante cambio de variable. Parecería que no hay nada para él, sino para escribir un $k+1$ $k+1$ matriz de derivados y hacer el cálculo.

Hay una mejor manera. Se muestra al final en la sección "Solución". Debido a que el propósito de este post es para presentar a los estadísticos lo que puede ser un nuevo método para muchos, gran parte de ella se dedica a explicar la maquinaria detrás de la solución. Este es el álgebra de formas diferenciales. (Formas diferenciales son las cosas que uno se integra en varias dimensiones). Un detalle, trabajó ejemplo se incluye para ayudar a hacer de esta más familiarizado.


De fondo

Hace más de un siglo, los matemáticos desarrollaron la teoría de la diferencial álgebra a trabajar con los "derivadas de orden mayor" que se producen en múltiples dimensiones de la geometría. El determinante es un caso especial de los objetos básicos manipulados por tales álgebras, que normalmente son la alternancia de formas multilineales. La belleza de esto radica en la forma simple los cálculos puede llegar a ser.

Aquí está todo lo que necesitas saber.

  1. Un diferencial es una expresión de la forma "$dx_i$". Es la concatenación de "$d$" con cualquier nombre de variable.

  2. Una sola forma es una combinación lineal de los diferenciales, tales como $dx_1+dx_2$$x_2 dx_1 - \exp(x_2) dx_2$. Es decir, los coeficientes son funciones de las variables.

  3. Los formularios se pueden "multiplicado", utilizando una cuña de producto, escrito $\wedge$. Este producto es anti-conmutativa (también llamado alterna): si cualquiera de las dos formas $\omega$$\eta$,

    $$\omega \wedge \eta = -\eta \wedge \omega.$$

    Esta multiplicación es lineal y asociativa: en otras palabras, se trabaja en el familiar de la moda. Una consecuencia inmediata es que el $\omega \wedge \omega = -\omega \wedge \omega$, lo que implica que el cuadrado de cualquier forma siempre es cero. Que hace la multiplicación muy fácil!

  4. Para los efectos de la manipulación de la integrands que aparecen en los cálculos de probabilidad, una expresión como $dx_1 dx_2 \cdots dx_{k+1}$ puede ser entendido como $|dx_1\wedge dx_2 \wedge \cdots \wedge dx_{k+1}|$.

  5. Al $y = g(x_1, \ldots, x_n)$ es una función, entonces su diferencial está dado por la diferenciación:

    $$dy = dg(x_1, \ldots, x_n) = \frac{\partial g}{\partial x_1}(x_1, \ldots, x_n) dx_1 + \cdots + \frac{\partial g}{\partial x_1}(x_1, \ldots, x_n) dx_n.$$

La conexión con Jacobians es este: el Jacobiano de una transformación $(y_1, \ldots, y_n) = F(x_1, \ldots, x_n) = (f_1(x_1, \ldots, x_n), \ldots, f_n(x_1, \ldots, x_n))$ es, hasta firmar, simplemente el coeficiente de $dx_1\wedge \dots \wedge dx_n$ que aparece en computación

$$dy_1 \wedge \cdots \wedge dy_n = df_1(x_1,\ldots, x_n)\wedge \cdots \wedge df_n(x_1, \ldots, x_n)$$

después de la expansión de cada una de las $df_i$ como una combinación lineal de las $dx_j$ en la regla (5).


Ejemplo

La simplicidad de esta definición de un Jacobiano es atractivo. Todavía no están convencidos de que vale la pena? Considerar el conocido problema de la conversión de dos dimensiones integrales de coordenadas Cartesianas $(x, y)$ a coordenadas polares $(r,\theta)$ donde $(x,y) = (r\cos(\theta), r\sin(\theta))$. El siguiente es un absolutamente aplicación mecánica de las reglas anteriores, donde "$(*)$" se utiliza para abreviar las expresiones que obviamente desaparecen por virtud de la regla (3), lo que implica $dr\wedge dr = d\theta\wedge d\theta = 0$.

$$\eqalign{ dx dy y= |dx\wedge dy| = |d(r\cos(\theta)) \wedge d(r\sin(\theta))| \\ y= |(\cos(\theta)dr - r\sin(\theta)d\theta) \wedge (\sin(\theta)dr + r\cos(\theta)d\theta| \\ y= |(*)dr\wedge dr + (*) d\theta\wedge d\theta - r\sin(\theta)d\theta\wedge \sin(\theta)dr + \cos(\theta)dr \wedge r\cos(\theta) d\theta| \\ & = |0 + 0 + r\sin^2(\theta) dr\wedge d\theta + r\cos^2(\theta) dr\wedge d\theta| \\ &= |r(\sin^2(\theta) + \cos^2(\theta)) dr\wedge d\theta)| \\ &= r\ dr d\theta }.$$

El punto de esto es la facilidad con que se pueden realizar cálculos, sin jugar con las matrices, determinantes, o en otras multi-indicial objetos. Usted acaba de multiplicar las cosas, recordando que las cuñas son anti-conmutativa. Es más fácil de lo que se enseña en la escuela secundaria álgebra.


Preliminares

Vamos a ver este diferencial álgebra en la acción. En este problema, el PDF de la distribución conjunta de $(X_1, X_2, \ldots, X_{k+1})$ es el producto de los documentos Pdf individuales (debido a que el $X_i$ son asumidos para ser independiente). Con el fin de manejar el cambio para las variables $Y_i$ debemos ser explícito acerca de los diferenciales de los elementos que se integrarán. Estos forman el plazo $dx_1 dx_2 \cdots dx_{k+1}$. Incluyendo el PDF nos da la probabilidad de elemento

$$\eqalign{ f_\mathbf{X}(\mathbf{x},\mathbf{\alpha})dx_1 \cdots dx_{k+1} &\propto \left(x_1^{\alpha_1-1}\exp\left(-x_1\right)\right)\cdots \left(x_{k+1}^{\alpha_{k+1}-1}\exp\left(-x_{k+1}\right) \right)dx_1 \cdots dx_{k+1} \\ &= x_1^{\alpha_1-1}\cdots x_{k+1}^{\alpha_{k+1}-1}\exp\left(-\left(x_1+\cdots+x_{k+1}\right)\right)dx_1 \cdots dx_{k+1}. }$$

(El de la normalización de la constante ha sido ignorado; será recuperado en el final).

Mirando a las definiciones de la $Y_i$ unos segundos debería ponen de manifiesto la utilidad de la introducción de la nueva variable

$$Z = X_1 + X_2 + \cdots + X_{k+1},$$

dar a las relaciones

$$X_i = Y_i Z.$$

Esto sugiere hacer el cambio de variables $x_i \to y_i z$ en la probabilidad de elemento. La intención es retener el primer $k$ variables $y_1, \ldots, y_k$ a lo largo de con $z$ y, a continuación, integrar a cabo $z$. Para ello, tenemos que volver a expresar todas las $dx_i$ en términos de las nuevas variables. Este es el corazón del problema. Es el lugar donde el diferencial álgebra se lleva a cabo. Para empezar,

$$dx_i = d(y_i z) = y_i dz + z dy_i.$$

Tenga en cuenta que desde $Y_1+Y_2+\cdots+Y_{k+1}=1$, luego

$$0 = d(1) = d(y_1 + y_2 + \cdots + y_{k+1}) = dy_1 + dy_2 + \cdots + dy_{k+1}.$$

Tenga en cuenta la forma

$$\omega = dx_1 + \cdots + dx_k = z(dy_1 + \cdots + dy_k) + (y_1+\cdots + y_k) dz.$$

Aparece en el diferencial de la última variable:

$$\eqalign{ dx_{k+1} &= z dy_{k+1} + y_{k+1}dz \\ y= -z(dy_1 + \cdots + dy_k) + (1-y_1-\cdots y_k)dz \\ &= dz - \omega. }$$

El valor de este se encuentra en la observación de que

$$dx_1 \wedge \cdots \wedge dx_k \wedge \omega = 0$$

porque, al expandir este producto, no es un término que contiene a $dx_1 \wedge dx_1 = 0$ factor, y el otro que contenga $dx_2 \wedge dx_2 = 0$, y así sucesivamente: todos ellos desaparecen. En consecuencia,

$$\eqalign{ dx_1 \wedge \cdots \wedge dx_k \wedge dx_{k+1} &= dx_1 \wedge \cdots \wedge dx_k \wedge z - dx_1 \wedge \cdots \wedge dx_k \wedge \omega \\ &= dx_1 \wedge \cdots \wedge dx_k \wedge z. }$$

De dónde (ya que todos los productos $dz\wedge dz$ a desaparecer),

$$\eqalign{ dx_1 \wedge \cdots \wedge dx_{k+1} &= (z dy_1 + y_1 dz) \wedge \cdots \wedge (z dy_k + y_k dz) \wedge dz \\ y= z^k dy_1 \wedge \cdots \wedge dy_k \wedge dz. }$$

El Jacobiano es, simplemente,$|z^k| = z^k$, el coeficiente de la diferencial del producto en el lado derecho.


Solución

La transformación de $(x_1, \ldots, x_k, x_{k+1})\to (y_1, \ldots, y_k, z)$ es uno-a-uno: su inversa está dada por $x_i = y_i z$$1\le i\le k$$x_{k+1} = z(1-y_1-\cdots-y_k)$. Por lo tanto, no tenemos problemas más acerca de la nueva probabilidad elemento; simplemente es

$$\eqalign{ y(z y_1)^{\alpha_1-1}\cdots (z y_k)^{\alpha_k-1}\left(z(1-y_1-\cdots-y_k)\right)^{\alpha_{k+1}-1}\exp\left(-z\right)|z^k dy_1 \wedge \cdots \wedge dy_k \wedge dz| \\ &= \left(z^{\alpha_1+\cdots+\alpha_{k+1}-1}\exp\left(-z\right) dz\right)\left( y_1^{\alpha_1-1} \cdots y_k^{\alpha_k-1}\left(1-y_1-\cdots-y_k\right)^{\alpha_{k+1}-1}dy_1 \cdots dy_k\right). }$$

Que es manifiestamente un producto de una Gamma$(\alpha_1+\cdots+\alpha_{k+1})$ distribución (por $Z$) y una de Dirichlet$(\mathbf\alpha)$ distribución (por $(Y_1,\ldots, Y_k)$). De hecho, desde la original de la normalización de la constante debe haber sido un producto de $\Gamma(\alpha_i)$, se deduce inmediatamente que la nueva normalización de la constante debe ser dividido por $\Gamma(\alpha_1+\cdots+\alpha_{k+1})$, lo que permitió el PDF para ser escrito

$$f_\mathbf{Y}(\mathbf{y},\mathbf{\alpha}) = \frac{\Gamma(\alpha_1+\cdots+\alpha_{k+1})}{\Gamma(\alpha_1)\cdots\Gamma(\alpha_{k+1})}\left( y_1^{\alpha_1-1} \cdots y_k^{\alpha_k-1}\left(1-y_1-\cdots-y_k\right)^{\alpha_{k+1}-1}\right).$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X