Estaba jugueteando con el PCA y LDA métodos y estoy atascado en un punto, tengo la sensación de que es tan simple que no lo veo.
Dentro de la clase ($S_W$) y entre los de clase ($S_B$) de la dispersión de las matrices se definen como:
$$ S_W = \sum_{i=1}^C\sum_{t=1}^N(x_t^i - \mu_i)(x_t^i - \mu_i)^T $$
$$ S_B = \sum_{i=1}^CN(\mu_i-\mu)(\mu_i-\mu)^T $$
Total de dispersión de la matriz $S_T$ es dada como:
$$ S_T = \sum_{i=1}^C\sum_{t=1}^N(x_t^i - \mu)(x_t^i - \mu)^T = S_W + S_B $$
donde C es el número de clases y N es el número de muestras $x$ son muestras, $\mu_i$ i-ésima clase media, $\mu$ es la media global.
Mientras que tratando de obtener $S_T$ llegué a un punto en el que tuve:
$$ (x-\mu_i)(\mu_i-\mu)^T + (\mu_i-\mu)(x-\mu_i)^T $$
como un término. Esto debe ser cero, pero ¿por qué?