2 votos

¿Existe un método fácil/rápido para calcular $\text{P}(X_i = \text{max}(X_1, \dots, X_n)), \forall i$ donde $X_i \sim \text{N}(\mu_i, \sigma_i)$ ?

Para $X_i \sim \text{N}(\mu_i, \sigma_i)$ ¿existe un método rápido para calcular (aproximadamente)

$$\text{P}\left(X_i = \text{max}(X_1, \dots, X_n)\right), \forall i$$

para un conjunto de $n$ tuplas de $(\mu_i, \sigma_i)$ , $i \in 1, \dots, n$ ? O en palabras, para todos $i$ ¿cuál es la probabilidad de que $X_i$ es el máximo de la muestra de $\{X_1, \dots, X_N\}$

Creo que la respuesta exacta viene dada por

$$ \text{P}\left(X_i = \text{max}(X_i, \dots, X_n)\right) = \frac{1}{\sqrt{2\pi\sigma_i}} \int_{-\infty}^{\infty} \exp\left(\frac{-(x-\mu_i)^2}{2\sigma_i}\right) \prod_{k \neq i} \Phi\left(\frac{x-\mu_k}{\sigma_k}\right) \text{dx} $$

donde $\Phi(x)$ es la función de distribución normal acumulativa.

Tengo que repetir este cálculo para $M$ diferentes conjuntos de $n$ tuplas. Me pregunto si existe una fórmula que pueda dar una aproximación que pueda ser vectorizada para un cálculo rápido cuando $n$ se conoce de antemano. Lo ideal sería evitar tener que realizar $M\times n$ integraciones numéricas.

Una idea que se me ocurrió fue entrenar a un modelo.

Dado que puedo calcular de antemano los valores exactos para un conjunto de $n$ tuplas, tal vez podría entrenar un modelo de aprendizaje automático que pudiera darme una aproximación rápida pero adecuada cuando $n$ ¿Está fijado? Podría configurarlo como un modelo de respuesta múltiple en el que los datos de entrada consistieran en filas de vectores hechos de concatenar $n$ generado aleatoriamente $(\mu_i, \sigma_i)$ y las respuestas se calculan utilizando la fórmula anterior. Puedo generar tantos datos como necesite.

1voto

michaelvobrien Puntos 166

Tenemos

\begin{align} P\left(X_i = \max(X_1, \dots, X_n)\right) &= E\left(\mathbb{I}_{\{X_i = \max(X_1, \dots, X_n)\}} \right)\\ &= E\left(E(\mathbb{I}_{\{X_i = \max(X_1, \dots, X_n)\}}|X_i) \right)\\ &= E\left(P(X_i = \max(X_1, \dots, X_n)|X_i) \right)\\ &= E\left(P(\bigcap_{k \ne i} \{X_k \le X_i\} |X_i) \right)\\ &= E\left( \prod_{k \ne i} P(X_k \le X_i |X_i) \right) \tag{1}\\ &= E\left( \prod_{k \ne i} \Phi\left(\frac{X_i-\mu_k}{\sigma_k}\right) \right) \\ &= \frac{1}{\sqrt{2\pi\sigma_i}}\int_\mathbb{R}\left(\exp\left(\frac{-(x-\mu_i)^2}{2\sigma_i}\right) \prod_{k \neq i} \Phi\left(\frac{x-\mu_k}{\sigma_k}\right)\right)dx \end{align}

En $(1)$ necesitamos la hipótesis de que $(X_i)_{i=1,...,n}$ son independientes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X