Estoy tratando de entender la prueba para la divergencia de Kullback-Leibler entre dos distribuciones normales multivariadas. En el camino, se aplica una especie de truco de traza para la expectativa de la forma cuadrática E[(x−μ)TΣ−1(x−μ)]=trace(E[(x−μ)(x−μ)T)]Σ−1),
donde x es MV-normal con media μ y matriz de covarianza Σ. La expectativa se toma sobre x.
Me gustaría entender por qué se cumple esta identidad. Creo que se dan más de un paso a la vez. Creo que trace(E[(x−μ)(x−μ)T]Σ−1) = trace(E[(x−μ)Σ−1(x−μ)T]), pero ¿de dónde viene la traza?