Loading [MathJax]/jax/element/mml/optable/GeneralPunctuation.js

19 votos

La "prueba de la segunda derivada" para f(x,y)

Actualmente estoy cursando cálculo multivariable, y estoy familiarizado con la prueba de la segunda derivada parcial. Es decir, la fórmula D(a,b)=fxx(a,b)fyy(a,b)(fxy(a,b))2 para determinar el comportamiento de f(x,y) en el punto (a,b,f(a,b)) .

Sin embargo, mi profesor se limitó a "escupirnos" esta fórmula y no nos dio casi ninguna explicación sobre su derivación o su origen. Después de investigar un poco por mi cuenta, ahora sé que es el determinante de la matriz hessiana para f(x,y) y veo cómo la fórmula se deriva fácilmente de esa matriz. Wikipedia sólo dice: En un punto crítico no degenerado puede aplicarse la siguiente prueba x . Si el hessiano es positivo definido en x entonces f alcanza un mínimo local en x . Si el hessiano es negativo definido en x entonces f alcanza un máximo local en x . Si el hessiano tiene valores propios positivos y negativos, entonces x es un punto de silla para f (esto es cierto incluso si x es degenerada). De lo contrario, la prueba no es concluyente".

Lo entiendo, pero sigo sin entender por qué el determinante de esta matriz pasa a modelar el comportamiento de f de esta manera. ¿Por qué? Y si la prueba falla, ¿qué pasos hay que dar para determinar la naturaleza de la enfermedad? f(x,y) en (a,b,f(a,b)) ?

16voto

Philip Fourie Puntos 12889

Esa matriz es simétrica. Es una consecuencia del álgebra lineal que una matriz simétrica es ortogonalmente diagonalizable. Eso significa que hay dos direcciones perpendiculares sobre las que esa matriz actúa como escalar por λ1 y por λ2 .

Estos λi representan el coeficiente cuadrático de una aproximación parabólica a la función f en (x0,y0) a medida que avanzas en la dirección de cada eigespacio. Puesto que usted ya está buscando en un punto crítico, la aproximación cuadrática está alcanzando su punta en (x0,y0) . Si los dos λi son de signo opuesto, tendrás dos parábolas ortogonales entre sí que se abren en direcciones diferentes, creando claramente una silla de montar. Si tenemos dos λi que sean del mismo signo, entonces dependiendo de ese signo tienes un max o un min.

Pero el determinante de un 2×2 resulta ser lo mismo que el producto de los dos valores propios. Así que usted puede ver cómo un determinante negativo implica λi de signo opuesto, lo que implica un punto de silla de montar, y un determinante positivo implica igualmente un máximo o un mínimo.


Localmente en cualquier (x0,y0) existe una versión de mayor dimensión de la serie de Taylor, agrupada aquí por orden creciente de derivada: f(x,y)=f(x0,y0)+[fx(x0,y0)(xx0)+fy(x0,y0)(yy0)]=+12[fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)=+fyx(x0,y0)(yy0)(xx0)+fyy(x0,y0)(yy0)2]+=f(x0,y0)+f(x0,y0)((x,y)(x0,y0))T=+12((x,y)(x0,y0))H(x0,y0)((x,y)(x0,y0))T+

Cuando se está en un punto crítico, esto se simplifica a f(x,y)=f(x0,y0)+12((x,y)(x0,y0))H(x0,y0)((x,y)(x0,y0))T+

Y si pudiéramos cambiar las coordenadas a un s y t variables que van en la dirección de H basados en el punto crítico, sólo tendríamos

f(s;t)=f(0;0)+12λ1s2+12λ2t2+ que espero ayude a ver las parábolas y el papel de los valores propios de H .

9voto

Iurii Puntos 11

Sea f:RnR una función dos veces diferenciable.

La segunda derivada se define como la derivada de la primera derivada xdf(x)L(Rn,R) pertenece, por tanto, al siguiente conjunto de funciones L(L(Rn,R),R) este conjunto es isomorfo al conjunto de funciones bilineales de RnR . Como f es dos veces diferenciable, el teorema de Schwarz demuestra que la forma bilineal d2f(x) es simétrica.

La matriz hessiana se define como la matriz asociada a la forma bilineal d2f(x) . Echemos un vistazo a lo que f ressembles localmente, uno tiene:

f(x+h)=f(x)+df(x).h+12d2f(x).h(2)+o( que se puede reescribir (utilizando el teorema de representación de Riez para definir el vector gradiente y las observaciones anteriores para la matriz hessiana), f(x+h)=f(x)+ \nabla f(x).h + \frac{1}{2}h^T\mathcal{H}f(x)h + o(\|h\|^2)

Por lo tanto, si x es un punto crítico que se tiene localmente:

f(x+h)=f(x)+ \frac{1}{2}h^T\mathcal{H}f(x)h + o(\|h\|^2)

A partir de esto podemos ver cómo la matriz hessiana nos va a ayudar a determinar el comportamiento de f localmente, por ejemplo si \mathcal{H}f(x) es una forma bilineal simétrica definida positiva, entonces si h es lo suficientemente pequeño f(x+h)-f(x)\geq 0 y así f alcanzará un mínimo local en x si \mathcal{H}f(x) es una forma bilineal simétrica definida negativa, entonces si h es lo suficientemente pequeño f(x+h)-f(x)\leq 0 así que f alcanzará un máximo local en x etc si no es ni lo uno ni lo otro es un punto de silla de montar, etc.

Podemos ver que los valores propios de \mathcal{H}f(x) van a ser esenciales para determinar si la matriz es o no definida positiva , definida negativa o no.

En el caso n=2 podemos escribir, si llamamos r=\frac{\partial^2 f}{\partial x^2} , t=\frac{\partial^2f}{\partial y^2} s=\frac{\partial^2f}{\partial x \partial y} , q(h)=d^2f(x).(h1,h2)^{(2)} = rh_1^2 +2sh_1h_2 +th_2^2 .

si r>0, q(h_1,h_2)=r[(h_1+\frac{s}{r}h_2)^2 + \frac{rt-s^2}{r^2}h_2^2]

y si rt-s^2>0 entonces q(h_1,h_2)\geq 0 y q(h_1,h_2)=0 \Rightarrow (h_1,h_2)=0 así que en este caso \mathcal{H}f(x) es positiva definida.

sin embargo rt-s^2<0 q cambia de signo.

El caso r<0 es igual que el anterior, salvo que "positivo" se convierte en negativo.

Por último, si r=0 no podemos concluir.

8voto

Psddp Puntos 251

Ésta es una prueba que sólo utiliza derivadas direccionales.

Queremos demostrar la Segunda prueba derivada .

Supongamos que las segundas derivadas parciales de f son continuas en un disco con centro (a, b), y supongamos que f_x(a,b)=f_y(a,b)=0 . Sea

H=\begin{vmatrix} f_{xx} & f_{xy} \\ f_{yx} & f_{yy} \end{vmatrix}=f_{xx}(a,b)f_{yy}(a,b)-[f_{xy}(a,b)]^2

(a) Si H>0, f_{xx}(a,b)>0 entonces f(a,b) es un mínimo local.

(b) Si H>0, f_{xx}(a,b)<0 entonces f(a,b) es un máximo local.

(c) Si H<0 entonces f(a,b) es un punto de silla de montar.

(d) Si H=0 no concluyente.

Sea u=(h, k) que es un vector unitario.

\begin{align} D^2_uf(x,y)&=D_u[D_uf(x,y)]\\ &=D_u[\nabla f\cdot u]\\ &=(f_{xx}h+f_{yx}k)h+(f_{xy}h+f_{yy}k)k \end{align}

Dado que las segundas derivadas parciales son continuas, f_{xy}=f_{yx}

\begin{align} D^2_uf(x,y)&=f_{xx}h^2+2f_{xy}hk+f_{yy}k^2\\ &=k^2(f_{xx}(\frac{h}{k})^2+2f_{xy}\frac{h}{k}+f_{yy}) \end{align}

Sea z=\frac{h}{k} , g(z)=f_{xx}z^2+2f_{xy}z+f_{yy}

Utiliza la función cuadrática anterior para hallar el rango de soluciones de D^2_uf(x,y) .

Sea d=(2f_{xy})^2-4f_{xx}f_{yy}=4(f_{xy}^2-f_{xx}f_{yy})=-4H

(1) Si d<0 significa que D^2_uf(x,y) sólo puede ser positivo o negativo.

Podemos saber que el punto (a,b) debe ser un mínimo o un máximo local.

\begin{align} D^2_uf(x,y)&=f_{xx}h^2+2f_{xy}hk+f_{yy}k^2\\ &=f_{xx}(h^2+2\frac{f_{xy}}{f_{xx}}hk+\frac{f_{yy}}{f_{xx}}k^2)\\ &=f_{xx}[(h+\frac{f_{xy}}{f_{xx}}k)^2+(f_{xx}f_{yy}-f_{xy}^2)k^2]\\ &=f_{xx}[(h+\frac{f_{xy}}{f_{xx}}k)^2+Hk^2] \end{align}

Sabemos que H>0 así que..,

si f_{xx}>0 la ecuación anterior siempre será positiva, lo que significa un mínimo local en (a,b) .

De lo contrario, si f_{xx}<0 siempre será negativo, lo que significa un máximo local en (a,b) .

(2) Si d>0 significa que D^2_uf(x,y) puede ser a la vez positivo, cero o negativo, por lo que

H<0 nos dice que la función tiene un punto de silla en (a,b) .

(3) Si d>0 significa que D^2_uf(x,y) sólo puede ser positivo y cero o negativo y cero, por lo que

H=0 no puede decir que si (a,b) es un mínimo local, un máximo local o un punto de silla de montar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X