Para $X_i \sim \text{N}(\mu_i, \sigma_i)$ ¿existe un método rápido para calcular (aproximadamente)
$$\text{P}\left(X_i = \text{max}(X_1, \dots, X_n)\right), \forall i$$
para un conjunto de $n$ tuplas de $(\mu_i, \sigma_i)$ , $i \in 1, \dots, n$ ? O en palabras, para todos $i$ ¿cuál es la probabilidad de que $X_i$ es el máximo de la muestra de $\{X_1, \dots, X_N\}$
Creo que la respuesta exacta viene dada por
$$ \text{P}\left(X_i = \text{max}(X_i, \dots, X_n)\right) = \frac{1}{\sqrt{2\pi\sigma_i}} \int_{-\infty}^{\infty} \exp\left(\frac{-(x-\mu_i)^2}{2\sigma_i}\right) \prod_{k \neq i} \Phi\left(\frac{x-\mu_k}{\sigma_k}\right) \text{dx} $$
donde $\Phi(x)$ es la función de distribución normal acumulativa.
Tengo que repetir este cálculo para $M$ diferentes conjuntos de $n$ tuplas. Me pregunto si existe una fórmula que pueda dar una aproximación que pueda ser vectorizada para un cálculo rápido cuando $n$ se conoce de antemano. Lo ideal sería evitar tener que realizar $M\times n$ integraciones numéricas.
Una idea que se me ocurrió fue entrenar a un modelo.
Dado que puedo calcular de antemano los valores exactos para un conjunto de $n$ tuplas, tal vez podría entrenar un modelo de aprendizaje automático que pudiera darme una aproximación rápida pero adecuada cuando $n$ ¿Está fijado? Podría configurarlo como un modelo de respuesta múltiple en el que los datos de entrada consistieran en filas de vectores hechos de concatenar $n$ generado aleatoriamente $(\mu_i, \sigma_i)$ y las respuestas se calculan utilizando la fórmula anterior. Puedo generar tantos datos como necesite.