En el libro Reconocimiento de patrones y aprendizaje automático por C.M Bishop en un lugar estamos tratando de encontrar la covarianza $\mathbf\Sigma$ de una distribución gaussiana multivariante dada por -
$$\frac1{({2\pi})^{D/2}} \frac1{{|\mathbf\Sigma|}^{1/2}} \exp\{ -\tfrac12(\mathbf x-\boldsymbol\mu)^T \boldsymbol\Sigma^{-1} (\mathbf x-\boldsymbol\mu) \}$$
Allí estamos intentando encontrar $E[\mathbf x \mathbf x^T]$ y nos encontramos con una integral de la forma - $\int {\mathbf x \mathbf x^T d\mathbf x}$ que debe evaluarse en todos los $\Bbb R^n$ .
¿Qué significa tener la matriz $\mathbf x \mathbf x^T$ en la integral? ¿Cómo se define la integral para evaluarla? ¿Se trata en realidad de una integral de volumen realizada sobre todos los componentes de la matriz?