Puedo explicar la solución de la ecuación anterior en inglés simple, pero no sé cómo explicarlo matemáticamente. Es obvio que porque $\sigma_1^2$ es mayor que otros $\sigma_i^2$s, si establecemos $c_1=1$ y $c_i=0$ para todos los $i \ne 1$, la función convexa se maximiza. ¿Pero podrías guiarme sobre cómo expresar esto matemáticamente?
¡Se aceptan enfoques diferentes!
Esta pregunta es del libro "Foundations of Data Science" por Blum, Hopcroft, Kannan (página 71, Ejercicio 3.24).