8 votos

Distribución de Von Mises-Fisher truncada

La voy a poner una de von Mises-Fisher antes en mis datos. Los datos no mienten en una unidad de la esfera, pero el único problema es que mis datos siempre es positivo. Así que me siento como que estoy perdiendo mi antes innecesarias espacio negativo. Este problema probablemente se mete exagerada una vez que entro en alto dimensiones (~500), ya que sólo estoy usando un solo cuadrante de los posibles $2^{500}$.

Así que mi pregunta es ¿cómo realizar la normalización de la constante:

Se sabe que $\int_{x\in S}\exp(\kappa\mu^Tx)dx$ donde S es la superficie de la unidad de la esfera es $\frac{(2\pi)^{p/2} I_{p/2-1}(\kappa) }{\kappa^{p/2-1}}$ donde $p$ es el número de dimensiones y $I$ es función modificada de Bessel de primera especie: http://en.wikipedia.org/wiki/Von_Mises%E2%80%93Fisher_distribution.

Sin embargo, ¿qué pasaría si yo restringir esta esfera en el primer cuadrante. es decir,$x_i>0$?

$$\int_{x\in S, x_i>0}\exp(\kappa\mu^Tx)dx=?$$

6voto

jldugger Puntos 7490

Debido a que el análisis no debe ser demasiado sensible a la previa, que debe sentirse libre para realizar modificaciones menores a la anterior. En lugar de truncar, ¿por qué no reflejan toda la probabilidad en la primera hyperquadrant? Es decir, continúe con el uso de von Mises-Fisher antes de $(x_1,x_2,\ldots,x_{n})$ ( $n\approx 500$ ), pero la base de su análisis en $(|x_1|,|x_2|,\ldots,|x_{n}|)$. Que no necesitaría de ninguna renormalization a todos.

La objeción surge de inmediato que los cálculos se requeriría un $500$veces la suma, que asciende a $2^{500}$ términos, lo cual es un imposible de cálculo. A pesar de que es cierto, un algebraicas simplificación hace posible. Yo soy lo que sugiere el uso de un previo

$$f(\mathbf x; \mu, \kappa) = C(\mu, \kappa) \sum_{i\in \{-1,1\}^n} \exp\left(\kappa (i_1 \mu_1, i_2\mu_2, \ldots, i_n\mu_n) \cdot \mathbf x\right)$$

donde $C(\mu,\kappa)$ es el de la normalización de la constante de von Mises-Fisher distribución con parámetros de $(\mu, \kappa)$ $x_i$ son no-negativos (y, sin pérdida de generalidad, se puede asumir todas las $\mu_i$ son no-negativos, también). Pero por separado por la realización de la suma sobre el último componente, lo anterior puede ser escrita

$$C(\mu \kappa) \sum_{i\in \{-1,1\}^{n-1}} \left(\exp\left(\kappa (i_1 \mu_1, i_2\mu_2, \ldots,\mu_n) \cdot \mathbf x\right) + \exp\left(\kappa (i_1 \mu_1, i_2\mu_2, \ldots,-\mu_n) \cdot \mathbf x\right)\right) \\ = C(\mu \kappa) 2\cosh(\kappa \mu_n x_n)\sum_{i\in \{-1,1\}^{n-1}} \exp\left(\kappa (i_1 \mu_1, i_2\mu_2, \ldots,i_{n-1}\mu_{n-1}) \cdot \mathbf x_{[-n]}\right)$$

donde $\mathbf x_{[-n]} = (x_1, x_2, \ldots, x_{n-1})$. Procedimiento inductivo en $n$ rendimientos

$$f(\mathbf x; \mu, \kappa) = C(\mu, \kappa) 2^n \prod_{i=1}^n \cosh(\kappa \mu_i x_i)$$

que es bastante manejable. Para $\kappa \gg 0$ (que es, como este antes de que crece un poco menos difuso), $f(\mathbf x; \mu, \kappa)$ enfoques de la truncada von Mises-Fisher distribución.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X