Hay $m$ se distribuye normalmente, independiente de las variables aleatorias $N_1, \ldots, N_m$ con medios distintos a $\mu_1, \ldots \mu_m$ y desviación estándar $\sigma_1, \ldots, \sigma_m$. Entonces, tenemos una permutación de los números de $\{1, \ldots, m\}$. ¿Cómo podemos calcular de manera eficiente, numéricamente, la (log) de la probabilidad de la observación de las variables aleatorias en el mismo orden como esta permutación?
Un ejemplo:
- tenemos cuatro variables aleatorias independientes $N_1, N_2, N_3, N_4$, todos con diferentes medias y varianzas.
- Se nos da la permutación (3, 1, 2, 4).
- Lo $\Pr(N_3 > N_1 > N_2 > N_4)$?
Una forma cerrada, la solución no es necesario, pero el cómputo de la solución mediante un algoritmo eficiente con buena precisión. También, es probable que sea necesario para calcular un registro de probabilidad debido al hecho de que cuando el número de variables es elevado, el cómputo de la real probabilidad resultará en un punto flotante de subdesbordamiento.
Algunos puntos de partida, tal vez...
La forma más directa para calcular este valor, utilizando el ejemplo anterior, es la evaluación de una de las siguientes integrales, que creo que son equivalentes:
$$ \int_{-\infty}^\infty \int_{n_4}^\infty \int_{n_2}^\infty \int_{n_1}^\infty p(n_1)p(n_2)p(n_3)p(n_4)\ dn_3 dn_1 dn_2 dn_4 $$
$$ \int_{-\infty}^\infty \int_{-\infty}^{n_3} \int_{-\infty}^{n_1} \int_{-\infty}^{n_2} p(n_1)p(n_2)p(n_3)p(n_4)\ dn_4 dn_2 dn_1 dn_3 $$
Donde $p(n_i)$ es la función de densidad de la variable $N_i$. Sin embargo, cuando traté de implementar este numéricamente, es ineficiente, propenso a la inexactitud, y se ejecuta en un subdesbordamiento de errores cuando el número de variables se hace grande. Si usted piensa que usted puede calcular esta integral en una forma aceptable, por favor envíe su respuesta!
De una de las siguientes respuestas, observamos que es posible calcular $\Pr(N_3 > N_1 > N_2 > N_4)$ directamente por la evaluación de una normal multivariante CDF de la dimensión $(m-1)$, o 3 en este caso. Sin embargo, esto es no trivial (aunque puede haber bibliotecas), y se subdesbordamiento de muchas variables.
Tal vez podemos dividir la probabilidad de la siguiente manera:
$$\Pr(N_3 > N_1 > N_2 > N_4) = $$ $$\Pr(N_3 > N_1 \mid N_1 > N_2, N_2 > N_4 )\Pr(N_1 > N_2 \mid N_2 > N_4 )\Pr(N_2 > N_4)$$
Ser capaces de calcular las probabilidades de cada parte directamente es muy fácil de calcular, el registro de probabilidad simplemente añadiendo. Se pueden calcular las probabilidades condicionales por separado, utilice la MVN CDF método que podría ayudar a si el producto puede subdesbordamiento.
Otra observación: el $m!$ posible las probabilidades correspondientes a los diferentes permutaciones debe sumar 1. Tal vez hay una manera de calcular las probabilidades de forma iterativa o usando programación dinámica: es decir: $(N_2 > N_3)$, un pedido de más de un par, tiene algunos fijos de probabilidad, la cual se divide en tres valores por los tres lugares posibles para insertar $N_1$ en los pedidos, divididos en los cuatro valores por los lugares posibles para insertar $N_3$. Este es semánticamente equivalente a las probabilidades condicionales anteriores, pero podría ser más fácil pensar en ello de esta manera.
Cualquier matemáticas asistentes tienen sugerencias sobre cómo solucionar este problema? Les agradecería mucho cualquier idea!