4 votos

Proyección de una distribución sobre la esfera unitaria en una norma arbitraria

Así que representamos la distribución Dirichlet como la proyección de la $d$ gammas independientes (en $R_+^d$ en el simplex unitario, y llegamos a él a través de la $L_1$ norma. Es decir, dividir ${\bf x} \in R_+^{d}$ por $r = \sum x_i$ para empujar los datos a la unidad simplex, $S_{1}^{d-1}$ . A continuación, integramos $r$ y se quedan con Dirichlet (o dirichlet generalizado, si se usan gammas de tasa variable).

Estoy tratando de establecer el jacobiano de la transformación entre ${\bf x} \in R_+^d$ y ${\bf y} \in S_{\omega}^{d-1}$ , donde $\omega$ especifica alguna norma arbitraria. Si queremos reducirla, entonces en la familia de $p$ -normas. Es decir, $$ r = \left(\sum x_i^p\right)^{1/p} $$ Así que puedes imaginarte, $p = 1$ define el simplex, $p = 2$ define la hiperesfera. Mi problema se define específicamente en la norma del infinito; $\lim_{p\to\infty} (\sum x_i^p)^{1/p} = \max x_i$

El determinante del jacobiano debe todavía sea $r^{d-1}$ pero no lo soy. ciertos de eso. Es realmente el ordenamiento de las variables lo que me está confundiendo; necesito terminar con un vector aleatorio $(r,y_{(1)},\ldots,y_{(d-1)})$ y la dimensión que cae es la máxima, pero eso es aleatorio.

¿Basta con demostrar que el determinante del jacobiano es el mismo independientemente de la dimensión que caiga?

EDIT: Para que quede claro, la transformación estándar del es algo así como: $$ \begin{aligned} T(x_1,\ldots,x_d) &= (r, y_1,\ldots,y_{d-1})\\ \implies T^{-1}(r,{\bf y}) &= \left(ry_1,\ldots,ry_{d-1},r(1-\sum_{i=1}^{d-1}y_i^p)^{1/p}\right) \end{aligned} $$ Pero cuando tomo el determinante del Jacobiano de esa transformación, termino con algo como $$ r^{d-1}\left[(1 - \sum_{i = 1}^{d-1}y_i^p)^{1/p} + \sum_{i = 1}^{d-1}y_i^p / (1 - \sum_{l = 1}^{d-1}y_l^p)^{1/p - 1}\right]. $$ Si tomo $p\to\infty$ Si no es así $y_d = 1$ , entonces el denominador va a 0.

2voto

jldugger Puntos 7490

Supongamos que $(X_1,\ldots,X_d)$ es una variable aleatoria continua positiva. Escribe su elemento de probabilidad conjunta como

$$f(x_1,\ldots,x_d)\,\mathrm{d}x_1 \cdots \mathrm{d}x_{d-1} \mathrm{d}x_d$$

para que la función de densidad sea $f(x_1,\ldots, x_d).$

Dejando el caso del $L^\infty$ norma para más adelante (es especial), considere $0\le p\lt \infty.$ Se pregunta por la densidad de la variable aleatoria

$$(Y_1,\ldots,Y_{d-1},R) = (X_1/R, \ldots, X_{d-1}/R, (X_1^p+\cdots+X_d^p)^{1/p}).$$

Se trata de una transformación invertible porque $X_i=R\,Y_i$ se define para $i=1,2,\ldots,d-1$ y $X_d = R\left(1 - Y_1^p-\cdots-Y_{d-1}^p\right)^{1/p}$ también es único.

Emulando la derivación de la distribución de Dirichlet mediante la álgebra de formas diferenciales , computa

$$\mathrm{d}x_i = r\,\mathrm{d}y_i + y_i\,\mathrm{d}r,\ i=1,2,\ldots, d-1$$

et

$$\begin{aligned} px_d^{p-1}\,\mathrm{d}x_d &= d\left(x_d^p\right) = \mathrm d\left(r^p-x_1^p-\cdots-x_{d-1}^p\right)\\ &= p\left(r^{p-1}\,\mathrm{d}r - x_1^{p-1}\,\mathrm{d}x_1 - \cdots - x_{d-1}^{p-1}\,\mathrm{d}x_{d-1}\right). \end{aligned}$$

Introdúzcalos para calcular el antiguo diferencial en términos de las nuevas variables y sus diferenciales:

$$\begin{aligned} \mathrm{d}x_1\wedge \cdots \wedge \mathrm{d}x_d &= \left(px_d^{p-1}\right)^{-1}\mathrm{d}x_1\wedge \cdots \wedge \mathrm{d}x_{d-1}\wedge \mathrm{d}(x_d^p)\\ &= \left(x_d^{p-1}\right)^{-1}\mathrm{d}x_1\wedge \cdots \wedge \mathrm{d}x_{d-1}\wedge \left(r^{p-1}\,\mathrm{d}r - x_1^{p-1}\,\mathrm{d}x_1 - \cdots - x_{d-1}^{p-1}\,\mathrm{d}x_{d-1}\right)\\ &= \left(x_d^{p-1}\right)^{-1}\mathrm{d}x_1\wedge \cdots \wedge \mathrm{d}x_{d-1}\wedge r^{p-1}\,\mathrm{d}r \\ &= \left(x_d^{p-1}\right)^{-1} \left(r\,\mathrm{d}y_1 + y_1\,\mathrm{d}r\right) \wedge \cdots \wedge \left(r\,\mathrm{d}y_{d-1} + y_{d-1}\,\mathrm{d}r\right) \wedge r^{p-1}\,\mathrm{d}r\\ &= r^{d-1}\left(\frac{r^{p-1}}{x_d^{p-1}}\right)\,\mathrm{d}y_1\wedge \cdots \wedge \mathrm{d}y_{d-1} \wedge \mathrm{d}r\\ &= r^{d-1}\left(1 - y_1^p - \cdots - y_{d-1}^p\right)^{1/p-1}\,\mathrm{d}y_1\wedge \cdots \wedge \mathrm{d}y_{d-1} \wedge \mathrm{d}r. \end{aligned} $$

El coeficiente de la forma diferencial es el jacobiano y (por tanto) la densidad de $(Y_1,\ldots, Y_{d-1})$ es

$$\begin{aligned} &g(y_1,\ldots, y_{d-1}) \\ &= \int_0^\infty f\left(ry_1, \ldots, ry_{d-1}, r\left(1-y_1^p-\cdots-y_{d-1}^p\right)^{1/p}\right)\, r^{d-1}\left(1 - y_1^p - \cdots - y_{d-1}^p\right)^{1/p-1}\,\mathrm{d}r. \end{aligned}$$


La dificultad cuando $p=\infty,$ donde $r=\max(x_i),$ es que $(y_1,\ldots, y_{d-1}) = (x_1/r,\ldots, x_{d-1}/r)$ ya no son coordenadas para la imagen de la proyección. Estas coordenadas sólo funcionan en el subconjunto en el que $x_d$ es el más grande.

Un enfoque sencillo consiste en descomponer la distribución en función de los eventos determinados por cuál de los $X_i$ es el más grande. Como la distribución conjunta es continua, la probabilidad de que haya un empate para el mayor es cero, por lo que se puede despreciar esa posibilidad. Dejemos que $K$ sea la variable aleatoria dada por el índice del mayor de los $X_i.$

Acondicionamiento primero en $K=d,$ tenemos $R=\max(X_i)=X_d$ y $Y_i = X_i/R = X_i/X_d$ para $i=1,2,\ldots, d-1.$ Calculando como antes obtenemos (fácilmente)

$$\mathrm{d}x_1\wedge \cdots \wedge \mathrm{d}x_{d} = r^{d-1}\, \mathrm{d}y_1\wedge \cdots \wedge \mathrm{d}y_{d-1}\wedge \mathrm{d}r.$$

Comparando esto con el $L^p$ obtenida anteriormente, podemos ofrecer un argumento intuitivo (a mano) para esta fórmula (como se sugiere en la pregunta): como $p$ crece, el factor $(1-y_1^p-\cdots -y_{d-1}^p)^{1/p-1}$ se acerca a $x_d^{-1} = r^{-1},$ dando $r^d(r^{-1})= r^{d-1}$ para el jacobiano.

Este análisis se aplica casi sin cambios cuando se condiciona a otros valores de $K:$ sólo hay que tomar la señal adecuada cuando se integra sobre $r$ en cada caso para asegurar que el resultado es una densidad positiva. En todos los casos el jacobiano sigue siendo igual a $r^{d-1}.$ La distribución completa de la proyección es un mezcla de la $d$ distribuciones condicionales. Cada uno de los $d$ componentes se apoya en una cara diferente del cubo de la unidad $I_d = (0,1]^d\subset \mathbb{R}^d;$ el componente correspondiente a $K=k$ es compatible con $\partial_k^{+} I_d = \{(y_1,\ldots,y_d)\mid 0\lt y_i\le 1;\ y_k=1\} \subset I_d.$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X