si el vector$\mathbf x$ se toma una muestra aleatoriamente de una distribución uniforme en$[0, 1]^d$, ¿cuál es la función de densidad de probabilidad para$|\mathbf x|$? ¿Es fácil escalar para$[0, n]^d$?
Respuestas
¿Demasiados anuncios?Una respuesta parcial. Si$X$ se distribuye uniformemente en$[0,1]$, entonces$X^2$ tiene pdf$$f(t) = \frac{1}{2 \sqrt{t}}$ $ para$t \in [0,1]$. Por lo tanto, el pdf de$| \mathbf{x}| = (\mathbf{x}_1^2 + \dotsc + \mathbf{x}_d^2)^{\frac{1}{2}}$ para$\mathbf{x} \in [0,1]^d$ es$$f_d(t) = 2t \, f^{\ast d}(t^2)$$ where $ f ^ {\ ast d}$ is the $ d$-fold convolution of $ f$. It looks like this pdf gets complicated quickly. For example already for $ d = 2 $ usando WA obtengo el siguiente pdf:
$$ f_2 (t) = \begin{cases} \frac{\pi t}{2} & \textrm{if } t\in[0,1]\\[1ex] t \left(\arcsin(t^{-1})-\arctan \sqrt{t^2-1}\right) & \textrm{if } t\in[1, \sqrt{2}] \end {casos} $$
Usted querrá pensar acerca de cómo calcular la medida de un hypersphere de radio $r$. Si tenemos $n$ dimensiones, estamos pidiendo para el conjunto $\sum x_i^2 \le r^2$. Esto es debido a que este conjunto describe todos los puntos con una magnitud $r$ o menos. Si nos imaginamos puntos distribuidos uniformemente a lo largo de este hypersphere, vamos a ver que la probabilidad de encontrar un punto en el radio de $r$ está relacionado con el tamaño de la concha con un radio de $r$.
Podemos calcular la medida de esta hypersphere haciendo una integral iterada. Para el caso de cuatro dimensiones tenemos:
$2^4\int_0^r \int ^{\sqrt{r^2-x_1^2}}_0 \int_0 ^\sqrt{r^2-x_1^2-x_2^2}\int_0^\sqrt{r^2-x_1^2-x_2^2-x_3^2} dx_4 dx_3 dx_2 dx_1$
Fácilmente podemos generalizar esto a cualquier dimensión. A continuación, tomamos nota de que el problema pide la densidad en el interior de un hipercubo, así que tomamos solamente la porción de la hypersphere que cruza nuestro hipercubo.
Deje $M(x) = \text{min}(x,1)$. A continuación, colocamos nuestro $2^n$ factor debido a que sólo estamos preocupados acerca de los componentes positivos. A continuación, nuestro CDF$(r)$ es
$\int_0^{M(r)} \int ^{M(\sqrt{r^2-x_1^2})}_0 \int_0 ^{M(\sqrt{r^2-x_1^2-x_2^2})}\int_0^{M(\sqrt{r^2-x_1^2-x_2^2-x_3^2})} dx_4 dx_3 dx_2 dx_1$
Para $r \le 1$ tenemos una solución fácil, porque el $M$s desaparecen y terminamos con el volumen de la n-dimensional hypersphere de radio $r$ dividido por $2^n$. Voy a actualizar la solución si encuentro una forma más simple donde $r \gt 1$.
Aquí está una formulación diferente / la generalización de dimensión arbitraria:
Vamos a una de las partículas aparecen con igual probabilidad en cualquier parte de la unidad n-hipercubo. Para $r \ge 0$ Deje $F_n(r)$ ser la probabilidad de que la partícula aparecerá dentro de $r$ distancia del origen.
Obviamente $F_1(r) =\text{min}(1,r)$ debido a que el caso unidimensional es un segmento de recta de longitud 1. (este es sólo un tonto forma de escribir el uniforme CDF porque no sé cómo dar formato a los de látex)
Ahora vamos a intentar calcular $F_n(r)$ en términos de $F_{n-1}$ imaginando que la partícula está restringido a un hyperplane donde una de las coordenadas se fija a $k$. Es decir, debe aparecer en el plano de la $\{k\} \times [0,1]^{n-1}$. Ya sólo nos permiten ir $r$ distancia desde el origen y utilizamos $k$ distancia ya, sólo podemos utilizar $\sqrt{r^2 - k^2}$ distancia en viaje desde el origen de la sub-cubo de $[0,1]^{n-1}$.
$F_n(r) = P(\sum{x_i^2} \le r^2)$
$ = \int_0^1P(\sum x_i^2 \le r^2 | x_1 = k)f_{x_1}(k)dk $
$ = \int_0^1P(\sum_{i\ne1} x_i^2 \le r^2 - k^2 | x_1 = k)dk $
$ = \int_0^1P(\sum_{i\ne1} x_i^2 \le r^2 - k^2 | x_1 = k)\mathbb{I}\{k \le r\le 1\}dk $
$ = \int_0^rP(\sum_{i\ne1} x_i^2 \le r^2 - k^2 | x_1 = k)\mathbb{I}\{r\le 1\}dk $
$ = \int_0^rF_{n-1}(\sqrt{r^2-k^2})\mathbb{I}\{r\le 1\}dk $
$ = \int_0^{\text{min}(r,1)}F_{n-1}(\sqrt{r^2-k^2})dk $
Así nos encontramos con:
$F_n(r) = \int_0^{\text{min}(r,1)}F_{n-1}(\sqrt{r^2-k^2})dk$
$F_1(r) =\text{min}(1,r)$
Por supuesto, si usted ampliar esta fórmula para $F_4$ obtendrá la misma en cuatro dimensiones mencionado anteriormente.
Voy a intentar explicar y ampliar los marcos de comentarios.
Creo que por un momnet en dos dimensiones. La densidad de probabilidad de que $|x|=r$ es la probabilidad de que de manera uniforme un punto elegido se encuentra a una distancia $r$ desde el origen. Esto es igual a la longitud de un arco de un círculo de radio $r$, se cruzó con la caja de la unidad. Ver los círculos en el dibujo:
Por lo tanto, es claro que para $r<1$ el PDF va a ser $\frac{\pi r}{2}$. Para $r>1$ simple trigonometría muestra que este arclength es $\frac{\pi}{2}-2\cos^{-1}\left(\frac{1}{r}\right)$. Así, obtenemos que para el 2D $$f(r)=\begin{cases} \frac{\pi }{2}r & r<1 \\ \frac{\pi }{2}-2\cos^{-1}\left(\frac{1}{r}\right) & r\geq 1 \\ \end{casos}$$ Cual es el resultado que WimC dio, pero simplificado.
En general, la dimensión, la búsqueda de la hiper-área de la intersección de la $d-1$ esfera con el hipercubo es bastante complicado para $r>1$. Sin embargo, es bastante sencillo para $r<1$ - la esfera está completamente contenida en la primera de hyper-cuadrante, por lo que su área es simplemente que del total de la superficie dividida por $2^d$. Tenemos que para una dimensión $d$ el PDF es
$$f(x)=\begin{cases} \frac{v_{d-1}}{2^d}r^{d-1} & r<1 \\[5mm] ??? & r\geq 1 \\ \end{casos}$$
Donde $v_{d-1}$ es el área de la unidad de $d-1$ ámbito.
Hay muchos diferentes densidades de probabilidad continua distribuciones $[0,1]^d$. También hay muchas distribuciones de probabilidad en la que el conjunto que no tienen densidades, incluyendo, pero no limitado a, las distribuciones discretas y mezclas discreta y continua de las distribuciones. Un punto puede ser tomaron muestras al azar de cualquiera de esas distribuciones.
Hay un poco desinformado de uso que es común entre los matemáticos que no son probabilists, según el cual, "al azar" significa "distribuidos de manera uniforme". Que es lo que se quiere decir, entonces, que la densidad es igual a $1$ en todas partes dentro del cubo. En $[0,n]^d$ la densidad de la distribución uniforme es $n^{-d}$ en cada punto.
Más tarde edit: Como se señaló en los comentarios, mi respuesta termina antes de llegar a la parte más difícil. Tal vez voy a añadir más tarde si nadie se me adelanta.
La densidad condicional dado el orden en el que las coordenadas que aparecen cuando se ordenan, no depende de que el orden es. Por lo tanto, podemos condición en el caso de que $x_1<x_2<x_3<\cdots<x_n$ y obtenemos la misma distribución.