EDIT: Las siguientes respuestas a una pregunta diferente de lo que se les pide - que se enmarca como si $\mu$ se considera al azar, pero no funciona al $\mu$ se considera fijo, que es probablemente lo que el OP tenía en mente. Si $\mu$ es fijo, no tengo una respuesta mejor que la de $\min(\hat\mu_1,...,\hat\mu_n)$
Si sólo se consideran las estimaciones de la media y la covarianza, podemos tratar a $(\mu_1, ..., \mu_n)$ como una sola muestra de la distribución normal multivariante. Una forma sencilla de obtener una estimación de la mínima, a continuación, dibujar un gran número de muestras de $MVN(\hat{\mu}, \Sigma)$, calcular el mínimo de cada muestra y, a continuación, tomar la media de los mínimos.
El procedimiento anterior y de sus limitaciones, puede ser entendido en Bayesiano términos de toma de la notación de la Wikipedia en MVN, si $\Sigma$ es el conocido covarianza de los estimadores y tenemos una observación, la articulación posterior distribución se $\mu \sim MVN(\frac{\hat{\mu} + m \lambda_0}{1 + m}, \frac{1}{n+m} \Sigma)$ donde $\lambda_0$ $m$ surgir a partir de la previa, donde, antes de observar los datos que tomar antes de la $\mu \sim MVN(\lambda_0, m^{-1} \Sigma$). Puesto que usted probablemente no están dispuestos a poner priores en $\mu$, podemos tomar el límite de $m \rightarrow 0$, lo que resulta en un plano anterior y la posterior, en $\mu \sim MVN(\hat{\mu}, \Sigma)$. Sin embargo, dada la plana antes de que nos están implícitamente haciendo la suposición de que los elementos de $\mu$ diferir mucho (si todos los números reales son igualmente probables, obteniendo valores similares es muy raro).
Una rápida simulación muestra que la estimación con este procedimiento ligeramente sobrestima $min(\mu)$ cuando los elementos de $\mu$ diferir mucho y subestima $min(\mu)$ cuando los elementos son similares. Uno podría argumentar que sin ningún conocimiento previo este es el comportamiento correcto. Si usted está dispuesto a estado al menos algo de información previa (por ejemplo,$m = 0.1$), el resultado podría ser un poco mejor comportamiento para el caso de uso.
Si estás dispuesto a asumir más estructura, usted podría ser capaz de elegir una mejor distribución de multivariete normal. También puede tener sentido utilizar Stan u otros MCMC sampler para adaptarse a las estimaciones de $\mu$ en el primer lugar. De esta manera se consigue un conjunto de muestras de $(\mu_1, ..., \mu_n)$ que reflejan la incertidumbre en los estimadores de sí mismo, incluyendo su estructura de covarianza (posiblemente más rico de lo MVN puede proporcionar). Una vez más, puede que calcular el mínimo de cada muestra para obtener una distribución posterior sobre los mínimos, y tomar la media de esta distribución, si usted necesita una estimación de punto.