Estoy leyendo lo siguiente del libro Aprendizaje profundo y tengo las siguientes preguntas.
- No entiendo muy bien las segundas derivadas direccionales. La primera derivada direccional de una función f:Rm→R en la dirección u representa la pendiente de f en la dirección u . Entonces, ¿qué hace la segunda derivada direccional a lo largo de la dirección u ¿Representar?
- En el párrafo anterior, entendí que d^THd la segunda derivada direccional de f en la dirección d ( ||d||_2=1 ), viene dado por el correspondiente valor propio cuando d es un vector propio de H porque si d es un vector propio de H entonces d^THd=d^T\lambda_d d=\lambda_d d^Td=\lambda_d . Sin embargo, no entiendo la afirmación "Para otras direcciones de d la segunda derivada direccional es una media ponderada de todos los valores propios, con pesos entre 0 y 1 "::-Desde H es simétrico real, H tiene m vectores propios independientes y ortogonales, que forman una base para \mathbb{R}^m . Por lo tanto, si d no es un vector propio, entonces d=c_1x_1+\cdots +c_mx_m para algunos escalares c_i s y vectores propios x_i s. Así, d^THd=d^TH(c_1x_1+\cdots +c_mx_m)\\=d^T(c_1\lambda_1x_1+\cdots +c_m\lambda_mx_m)\\=c_1^2||x_1||^2\lambda_1 +\cdots +c_m^2||x_m||^2\lambda_m que es, por supuesto, la media ponderada de todos los valores propios de H . Pero no entiendo por qué los pesos se encuentran entre 0 y 1 como se ha dado. De hecho, no hay ninguna razón para creer que los pesos c_i^2||x_i||^2 para estar en el rango (0,1) .
- Además, no entiendo la afirmación "El valor propio máximo determina la segunda derivada máxima, y el valor propio mínimo determina la segunda derivada mínima". ¿Puede explicar esto?