Su función puede escribirse de la forma $$ g(C) = \operatorname{tr}[(Y - CX)(Y - CX)'] = \operatorname{tr}[CXX'C] - 2\operatorname{tr}[CXY'] + [\text{const}] $$ Tras esta tabla el gradiente (ya sea la transposición de la derivada en la columna de la izquierda o, de forma equivalente, la derivada en la columna de la derecha) será $$ \frac{\partial g}{\partial C} = [(Y - CX)(-X') + (-X)(Y - CX)']' - [2XY']' \\ = -X(Y - CX)' - (Y - CX)X' - 2YX'. $$
Para un enfoque más abstracto, observe que
$$ g(C+H) = \operatorname{tr}[(Y - [C+H]X)(Y - [C+H]X)']\\ = g(C) - \operatorname{tr}[HX(Y - CX)'] - \operatorname{tr}[(Y - CX)X'] + o(H)\\ = g(C) - 2\operatorname{tr}[HX(Y - CX)'] + o(H). $$ Por lo tanto, consideramos que $dg = -\operatorname{tr}[2X(Y - CX)' dC]$ para que el gradiente sea igual a $$ -[X(Y - CX)']' = -2(Y - CX)X'. $$ Esto coincide con su resultado.