Un (verdadero) matriz simétrica tiene un completo conjunto ortogonal de vectores propios para que los correspondientes autovalores son todos los números reales. Para los no-simétrica matrices pueden fracasar. Por ejemplo, una rotación en el espacio de dos dimensiones no tiene vector propio o autovalores de los números reales, se debe pasar a un espacio vectorial sobre el de los números complejos para encontrarlos.
Si la matriz es, además, positiva definida, entonces estos autovalores son todos los números reales positivos. Este hecho es mucho más fácil que la primera, porque si $v$ es un autovector con unidad de longitud, y $\lambda$ el correspondiente autovalor, entonces
$$ \lambda = \lambda v^t v = v^t A v > 0 $$
donde la última igualdad se utiliza la definición positiva de la certeza.
La importancia de la intuición es que los vectores propios y valores propios de una transformación lineal que describa el sistema de coordenadas en el que la transformación es más fácil de comprender. Una transformación lineal puede ser muy difícil de entender en una forma "natural" como el estándar de sistema de coordenadas, pero cada uno viene con un "preferidas" de la base de vectores propios en los que la transformación actúa como una escala en todas las direcciones. Esto hace que la geometría de la transformación mucho más fácil de entender.
Por ejemplo, la prueba de la segunda derivada para extremos locales de una función de $R^2 \rightarrow R$ a menudo se administra como una serie de misteriosos condiciones que impliquen una entrada en la segunda derivada de la matriz y de algunos determinantes. De hecho, estas condiciones simplemente codificar el siguiente geométrica de observación:
- Si la matriz de las segundas derivadas es positiva definida, usted está en un mínimo local.
- Si la matriz de las segundas derivadas es negativo definitiva, estás en un máximo local.
- De lo contrario, en ninguno de los dos, un punto de silla.
Usted puede entender esto con el geométrico razonamiento anteriormente en un eigenbasis. La primera derivada en un punto crítico que se desvanece, por lo que las tasas de cambio de la función aquí están controlados por la segunda derivada. Ahora podemos razón geométricamente
- En el primer caso hay dos eigen-las direcciones, y si se mueven a lo largo de la función aumenta.
- En la segunda, dos eigen-las direcciones, y si se mueven, ya sea en la función disminuye.
- En la última, hay dos eigen-las direcciones, pero en uno de ellos la función aumenta y en otras disminuye.
Puesto que los vectores propios ocupar la totalidad del espacio, cualquier otra dirección es una combinación lineal de eigen-las direcciones, por lo que las tasas de cambio en esas direcciones son combinaciones lineales de las tasas de cambio en el eigen direcciones. Así que, de hecho, esto se aplica en todas las direcciones (esto es más o menos lo que significa para una función definida en un espacio de dimensiones superiores para ser diferenciable). Ahora bien, si se dibuja un poco la imagen en tu cabeza, esto hace un montón de sentido de algo que es muy misteriosa en principiante cálculo de los textos.
Esto se aplica directamente a uno de los puntos de bala
La forma cuadrática $\frac 1 2 x^\top Ax-b^\top x +c$ es convexo, si $A$ es SPD. Convexo es una agradable propiedad que puede asegurarse de que la solución local es la solución global
La matriz de las segundas derivadas es $A$ en todas partes, que es simétrica positiva definida. Geométricamente, esto significa que si nos alejamos en cualquier eigen-dirección (y por lo tanto cualquier dirección, porque cualquier otro es una combinación lineal de eigen-direcciones) de la propia función se doble de distancia por encima de lo plano tangente. Esto significa que toda la superficie es convexa.