12 votos

Derivadas totales y funciones multilineales

Así que estoy empezando a trabajar a través de Spivak Cálculo sobre Múltiples y estoy teniendo un poco de problemas para verificar algunas de las afirmaciones hechas en los problemas del libro. Para revisar:

Dada una función $\mathbf{f}:\mathbb{R}^{n}\to\mathbb{R}^m$ decimos que $\mathbf{f}$ es diferenciable en un punto $\mathbf{a}=(a^{1},\ldots,a^{n})\in\mathbb{R}^n$ (considerado como un $1\times n$ ) si existe una transformación lineal, $D\mathbf{f}(\mathbf{a}):\mathbb{R}^n\to\mathbb{R}^m$ (considerado como un $m\times n$ ) tal que $$\lim\limits_{\mathbf{h}\to\mathbf{a}}\dfrac{||\mathbf{f}(\mathbf{a}+\mathbf{h})-\mathbf{f}(\mathbf{a})-D\mathbf{f}(\mathbf{a})(\mathbf{h})||}{||\mathbf{h}||}=0.$$

$D\mathbf{f}(\mathbf{a})$ se llama derivado total o Matriz jacobiana de $\mathbf{f}$ en $\mathbf{a}$ y es único.

A continuación, se nos pide que demostremos que si $\mathbf{f}:\mathbb{R}^n\times\mathbb{R}^m\to\mathbb{R}^p$ es bilineal, entonces $$\lim\limits_{(\mathbf{h},\mathbf{k})\to\mathbf{0}}\dfrac{||\mathbf{f}(\mathbf{h},\mathbf{k})||}{||(\mathbf{h},\mathbf{k})||}=0.$$

El mejor enfoque que se me ocurrió fue que $||\mathbf{f}(\mathbf{h},\mathbf{k})||=||\mathbf{h}||\cdot||\mathbf{k}||\cdot||\mathbf{f}(\hat{\mathbf{h}},\hat{\mathbf{k}})||$ , donde $\hat{\mathbf{x}}=\frac{\mathbf{x}}{||\mathbf{x}||}$ . Entonces tenemos que $||\mathbf{h}||\cdot||\mathbf{k}||\leq||\mathbf{h}||^{2}+||\mathbf{k}||^{2}=||(\mathbf{h},\mathbf{k})||^{2}$ , lo que nos da $$\dfrac{||\mathbf{f}(\mathbf{h},\mathbf{k})||}{||(\mathbf{h},\mathbf{k})||}\leq||(\mathbf{h},\mathbf{k})||\cdot||\mathbf{f}(\hat{\mathbf{h}},\hat{\mathbf{k}})||,$$ donde $||\hat{\mathbf{h}}||=||\hat{\mathbf{k}}||=1$ . Y como $||\mathbf{f}(\mathbf{x},\mathbf{y})||\leq||\mathbf{f}(\hat{\mathbf{x}},\mathbf{y})||\cdot||\mathbf{x}||$ (de manera similar para $\mathbf{y}$ ) entonces $f$ es un limitado ( continuo ) la transformación lineal y $$||\mathbf{f}||_{x}=\sup\{||\mathbf{f}(\mathbf{x},\mathbf{y})||:||\mathbf{x}||=1\}<\infty$$ $$||\mathbf{f}||_{y}=\sup\{||\mathbf{f}(\mathbf{x},\mathbf{y})||:||\mathbf{y}||=1\}<\infty,$$ lo cual esperaba que implicara que $||\mathbf{f}(\hat{\mathbf{h}},\hat{\mathbf{k}})||<\infty$ y así tendríamos el resultado que buscamos. Pero estoy atascado aquí.

Asumiendo este resultado, pude completar el problema y demostrar que $$D\mathbf{f}(\mathbf{a},\mathbf{b})(\mathbf{x},\mathbf{y})=\mathbf{f}(\mathbf{a},\mathbf{y})+\mathbf{f}(\mathbf{x},\mathbf{b}).$$


El autor procede a pedirnos que demostremos lo siguiente:

Dada una función multilineal $\mathbf{f}:\mathbb{R}^{n_1}\times\cdots\times\mathbb{R}^{n_k}\to\mathbb{R}^p$ , demuestran que para $\mathbf{h}=(\mathbf{h}_1,\dots,\mathbf{h}_k)$ con $\mathbf{h}_i\in\mathbb{R}^{n_i}$ tenemos $$\lim\limits_{\mathbf{h}\to\mathbf{0}}\dfrac{||\mathbf{f}(\mathbf{a}_1,\ldots,\mathbf{a}_{i-1},\mathbf{h}_i,\mathbf{a}_{i+1}\ldots,\mathbf{a_{j-1}},\mathbf{h}_j,\mathbf{a}_{j+1},\ldots,\mathbf{a}_k)||}{||\mathbf{h}||}=0,$$ para $i\neq j$ . Utiliza esto para demostrar que $$D\mathbf{f}(\mathbf{a}_1,\ldots,\mathbf{a}_k)(\mathbf{x}_1,\ldots,\mathbf{x}_k)=\sum_{i=1}^{k}{\mathbf{f}(\mathbf{a}_1,\ldots,\mathbf{a}_{i-1},\mathbf{x}_i,\mathbf{a}_{i+1}\ldots,\mathbf{a}_k)}.$$

Usando la pista del libro de considerar la función bilineal, $\mathbf{g}(\mathbf{x},\mathbf{y})=\mathbf{f}(\mathbf{a}_1,\ldots,\mathbf{x},\ldots,\mathbf{y},\ldots,\mathbf{a}_k)$ En este caso, he podido demostrar la primera parte del problema asumiendo el resultado anterior (que todavía no puedo demostrar). Sin embargo, ahora también estoy atascado en cómo demostrar el resto de la pregunta.

Por ejemplo, consideremos el caso específico con tres argumentos. Utilizando el hecho de que $\mathbf{f}$ es multilineal, tenemos $$\mathbf{f}(\mathbf{a}+\mathbf{h_1},\mathbf{b}+\mathbf{h_2},\mathbf{c}+\mathbf{h_3})-\mathbf{f}(\mathbf{a},\mathbf{b},\mathbf{c})=$$ $$\mathbf{f}(\mathbf{a},\mathbf{b},\mathbf{h_3})+\mathbf{f}(\mathbf{a},\mathbf{h_2},\mathbf{c})+\mathbf{f}(\mathbf{h_1},\mathbf{b},\mathbf{c}) +$$ $$+\mathbf{f}(\mathbf{a},\mathbf{h_2},\mathbf{h_3})+\mathbf{f}(\mathbf{h_1},\mathbf{b},\mathbf{h_3})+\mathbf{f}(\mathbf{h_1},\mathbf{h_2},\mathbf{c})+$$ $$+\mathbf{f}(\mathbf{h_1},\mathbf{h_2},\mathbf{h_3}).$$ Los tres primeros términos son los que debe sea $D\mathbf{f}(\mathbf{a},\mathbf{b},\mathbf{c})$ mientras que los tres siguientes desaparecerán en el límite dado la primera parte de la prueba. El problema es cómo controlar el límite $\lim\limits_{\mathbf{h}\to\mathbf{0}}\frac{||\mathbf{f}(\mathbf{h_1},\mathbf{h_2},\mathbf{h_3})||}{||(\mathbf{h_1},\mathbf{h_2},\mathbf{h_3})||}$ ? Este problema surge también en el caso general, cada vez que el número de $\mathbf{h_i}$ es más de dos en un solo término. Por ejemplo, ¿cómo podría controlar el término $\mathbf{f}(\mathbf{a_1},\mathbf{a_2},\mathbf{h_3},\mathbf{h_4})$ que tiene dos " $h$ " y " $a$ ¿"términos" cada uno?

Gracias por cualquier ayuda. Mis habilidades de análisis están un poco oxidadas ya que me he centrado en aprobar mi calificación de álgebra.

6voto

Ken Burkhardt Puntos 419

esto es solo un comentario para que veas por qué $k$ -Las funciones lineales en espacios de dimensión finita están acotadas.

para ver que las formas bilineales en espacios de dimensión finita están acotadas se puede argumentar así: (usando tu notación)

Dejemos que ${\bf x}=(x_1,\ldots,x_n)$ y ${\bf y}=(y_1,\ldots,y_m)$ sean vectores unitarios en $\mathbb{R}^n$ y $\mathbb{R}^m$ respectivamente, entonces $$ \left\|{\bf f}({\bf x},{\bf y})\right\|=\left\|\sum_{i=1}^n\sum_{j=1}^m x_iy_j\ {\bf f}(e_i,e_j)\right\| \leq \max_{i,j}\ \|{\bf f}(e_i,e_j)\|\sum_{i=1}^n\sum_{j=1}^m (x^2_i+y^2_j). $$ Si llamamos a $M=\max_{i,j}\ \|{\bf f}(e_i,e_j)\|$ tenemos de la desigualdad anterior que $$ \|{\bf f}({\bf x},{\bf y})\| \leq M(m+n)\|{\bf x}\|^2\cdot \|{\bf y}\|^2 $$ Desde ${\bf x}$ y ${\bf y}$ son vectores unitarios se deduce que ${\bf f}$ está limitada por $M(m+n)$ . Espero que pueda extender esto para cualquier $k$ -función lineal.

6voto

Dado que las otras dos respuestas son más o menos sólo pistas hacia la respuesta completa, presento mi solución a continuación para aclarar mis propias ideas.

Las preguntas de la OP son de los problemas 2-12 y 2-14 de la obra de Spivak Cálculo sobre Múltiples .


Queremos demostrar que si $f \colon \mathbb{R}^n \times \mathbb{R}^m \to \mathbb{R}^p$ es bilineal, entonces $$ \lim_{(h,k) \to 0} \frac{|f(h,k)|}{|(h,k)|} = 0. $$ Por lo tanto, tomamos una pista de la prueba de Spivak del Teorema 2-3(5) (dada en la página 21): allí él calcula la derivada de $p \colon \mathbb{R}^2 \to \mathbb{R}$ definido como $p(x,y) = x \cdot y$ . Como en realidad se trata de una función bilineal, la idea de la prueba se mantiene.

Por lo tanto, dejemos que $h = (h^1,\dots,h^n) \in \mathbb{R}^n$ y $k = (k^1,\dots,k^m) \in \mathbb{R}^m$ . Dejemos que $e_1,\dots,e_n$ sea la base estándar de $\mathbb{R}^n$ y que $\tilde{e}_1,\dots,\tilde{e}_m$ sea la base estándar de $\mathbb{R}^m$ . Entonces, $$ f(h,k) = \sum_{i=1}^n \sum_{j=1}^m h^i k^j f(e_i,\tilde{e}_j). $$ Dejemos que $M = \max\{ |f(e_i,\tilde{e}_j)| : 1 \leq i \leq n, 1 \leq j \leq m \}$ . Entonces, para $(h,k) \neq (0,0)$ tenemos $$ \begin{align} \frac{|f(h,k)|}{|(h,k)|} &= \frac{\left|\sum_{i=1}^n \sum_{j=1}^m h^i k^j f(e_i,\tilde{e}_j)\right|}{|(h,k)|} \\ &\leq \sum_{i=1}^n \sum_{j=1}^m \frac{|h^i k^j f(e_i,\tilde{e}_j)|}{|(h,k)|}\\ & \leq M \sum_{i=1}^n \sum_{j=1}^m \frac{|h^i k^j|}{|(h,k)|}. \end{align} $$ Tenga en cuenta que $$ |h^i k^j| \leq \begin{cases} |h^i|^2, & k^j \leq h^i;\\ |k^j|^2, & h^i \leq k^j. \end{cases} $$ Por lo tanto, $$ |h^i k^j| \leq |h^i|^2 + |k^j|^2 \leq |h|^2 + |k|^2. $$ Por lo tanto, para $(h,k) \neq (0,0)$ tenemos $$ \frac{|h^i k^j|}{|(h,k)|} \leq |(h,k)|. $$ Por lo tanto, $$ \frac{|f(h,k)|}{|(h,k)|} \leq Mmn|(h,k)|. $$ Tomando $\lim_{(h,k) \to 0}$ en ambos lados, obtenemos el resultado deseado.


Ahora, dejemos que $k \geq 2$ . Para comprobar que la derivada de la función multilineal $f \colon E_1 \times \dots \times E_k \to \mathbb{R}^p$ en el punto $(a_1,\dots,a_k)$ viene dada por $$ Df(a_1,\dots,a_k)(x_1,\dots,x_k) = \sum_{i=1}^k f(a_1,\dots,a_{i-1},x,a_{i+1},\dots,a_k), $$ donde el $E_i$ son espacios euclidianos de dimensión $n_i$ tenemos que comprobar que $$ \lim_{h \to 0} \frac{\left|f(a_1+h_1,\dots,a_k+h_k) - f(a_1,\dots,a_k) - \sum_{i=1}^k f(a_1,\dots,a_{i-1},h_i,a_{i+1},\dots,a_k)\right|}{|h|} = 0. $$

La expresión dentro del límite se puede simplificar de la siguiente manera.

Desde $h_i \in E_i$ para cada $1 \leq i \leq k$ , dejemos que $h_i = (h_i^1,\dots,h_i^{n_i})$ para cada $1 \leq i \leq k$ . Para cada $2 \leq l \leq k$ , dejemos que $I = (i_1,\dots,i_l)$ ser un $l$ -que es tal que $1 \leq i_1 < \dots < i_l \leq k$ . Llamaremos a este tipo de $I$ un $l$ -barajar (tenga en cuenta que esta terminología no es estándar). Para cada $1 \leq i \leq k$ , dejemos que $e_i^1,\dots,e_i^{n_i}$ sea la base estándar de $E_i$ .

Ahora, $$ \begin{align} f(a_1+h_1,\dots,a_k+h_k) &= f(a_1,\dots,a_k) + \sum_{i = 1}^k f(a_1,\dots,a_{i-1},h_i,a_{i+1},\dots,a_k) \\ & \qquad {}+ \sum_{l=2}^k \sum_{\substack{I=(i_1,\dotsc,i_l) \\ l\mathrm{-shuffles}}} f(a_1,\dots,a_{i_1 - 1},h_{i_1},a_{i_1 +1},\dots,a_{i_l - 1},h_{i_l},a_{i_l + 1},\dots,a_k). \end{align} $$ Considera el término dentro de la última suma. $$ \begin{align} &\ \ f(a_1,\dots,a_{i_1 - 1},h_{i_1},a_{i_1 +1},\dots,a_{i_l - 1},h_{i_l},a_{i_l + 1},\dots,a_k)\\ = \ &\sum_{j_1=1}^{n_{i_1}} \cdots \sum_{j_l = 1}^{n_{i_l}} h_{i_1}^{j_1} \cdots h_{i_l}^{j_l} f(a_1,\dots,a_{i_1 - 1},e_{i_1}^{j_1},a_{i_1 + 1},\dots,a_{i_l - 1},e_{i_l}^{j_l},a_{i_l + 1},\dots,a_k). \end{align} $$ Dejemos que $$ M_I = \max\{ |f(a_1,\dots,a_{i_1 - 1},e_{i_1}^{j_1},a_{i_1 + 1},\dots,a_{i_l - 1},e_{i_l}^{j_l},a_{i_l + 1},\dots,a_k)| : 1 \leq j_1 \leq n_{i_1},\dots,1 \leq j_l \leq n_{i_l} \}. $$ Entonces, $$ \begin{align} & |f(a_1,\dots,a_{i_1 - 1},h_{i_1},a_{i_1 +1},\dots,a_{i_l - 1},h_{i_l},a_{i_l + 1},\dots,a_k)|\\ \leq \ &M_I \sum_{j_1=1}^{n_{i_1}} \cdots \sum_{j_l = 1}^{n_{i_l}} \left| h_{i_1}^{j_1} \cdots h_{i_l}^{j_l} \right|. \end{align} $$ Dado que nos interesa el límite como $h$ va a $0$ podemos suponer que $0 \leq \left|h_{i_1}^{j_1}\right|,\dots,\left|h_{i_l}^{j_l}\right| \leq 1$ . En particular, para $(h_{i_1}^{j_1},\dots,h_{i_l}^{j_l}) \neq (0,\dots,0)$ , obtenemos que $$ \left|h_{i_1}^{j_1}\cdots h_{i_l}^{j_l}\right| \leq \left|h_{i_1}^{j_1} h_{i_2}^{j_2} \right|\\ \implies \frac{\left|h_{i_1}^{j_1}\cdots h_{i_l}^{j_l}\right|}{\left(\left| h_{i_1}^{j_1} \right|^2 + \dots + \left| h_{i_l}^{j_l} \right|^2 \right)^{1/2}} \leq \frac{\left|h_{i_1}^{j_1} h_{i_2}^{j_2} \right|}{\left(\left| h_{i_1}^{j_1} \right|^2 + \dots + \left| h_{i_l}^{j_l} \right|^2 \right)^{1/2}} \leq \frac{\left|h_{i_1}^{j_1} h_{i_2}^{j_2} \right|}{\left(\left| h_{i_1}^{j_1} \right|^2 + \left| h_{i_2}^{j_2} \right|^2 \right)^{1/2}} $$ Por lo que hemos demostrado para las funciones bilineales, está claro que $$ \lim_{\substack{h \to 0\\ (h_{i_1}^{j_1},\dots,h_{i_l}^{j_l}) \neq (0,\dots,0)}} \frac{\left|h_{i_1}^{j_1}\cdots h_{i_l}^{j_l}\right|}{|h|} = 0. $$ Además, el límite anterior es obviamente cero incluso sin la condición $(h_{i_1}^{j_1},\dots,h_{i_l}^{j_l}) \neq (0,\dots,0)$ . Por lo tanto, $$ \lim_{h \to 0} \frac{\left|h_{i_1}^{j_1}\cdots h_{i_l}^{j_l}\right|}{|h|} = 0. $$ Esto es cierto para todos los $l$ -barajar $I$ para cada $2 \leq l \leq k$ . Por lo tanto, utilizando la desigualdad del triángulo, obtenemos que $$ \lim_{h \to 0} \frac{\left|f(a_1+h_1,\dots,a_k+h_k) - f(a_1,\dots,a_k) - \sum_{i=1}^k f(a_1,\dots,a_{i-1},h_i,a_{i+1},\dots,a_k)\right|}{|h|} = 0. $$

2voto

jW. Puntos 3430

@Leandro Gracias por la ayuda; eso me hizo ir en la dirección correcta. Me costó verificar tu desigualdad exacta, pero no creo que importe mucho. He conseguido que $$\left\| {\bf f}({\bf x},{\bf y}) \right\|=\left\| \sum_{i=1}^{n}\sum_{j=1}^{m}{x^{i}y^{j}{\bf f}({\bf e}_i,{\bf e}_j)} \right\| \leq \max_{i,j}\left\| {\bf f}({\bf e}_i,{\bf e}_j) \right\|\sum_{i=1}^{n}\sum_{j=1}^{m}{|x^{i}y^{j}|}$$

y que $|x^iy^j|\leq|x^i|^2+|y^j|^2$ Por lo tanto

$$\left\| {\bf f}({\bf x},{\bf y}) \right\| \leq M \sum_{i=1}^{n}\sum_{j=1}^{m}{|x^{i}|^2+|y^{j}|^2}.$$

Pero $\sum_{i=1}^{n}\sum_{j=1}^{m}{|x^{i}|^2+|y^{j}|^2} = m\left\| {\bf x} \right\|^2 + n\left\| {\bf y} \right\|^2 = (n+m)$ si ${\bf x}$ y ${\bf y}$ son vectores unitarios. Por lo tanto tengo que $\left\| {\bf f}({\bf x},{\bf y}) \right\| \leq M(n+m)$ que sigue siendo independiente de ambos $\bf x$ y $\bf y$ para que $\bf f$ está acotado. Además, ¿no es este límite independiente de la norma también, aparte del valor de $M$ ?

El proceso es más o menos idéntico para las funciones lineales superiores, con sólo el máximo $M$ (definido de la misma manera) y el producto y la suma de las dimensiones de los espacios que contribuyen al límite final de $\left\| {\bf f}({\bf x}_1,\ldots,{\bf x}_k) \right\|$ . Esto me da la última información que necesitaba para demostrar que $D{\bf f}({\bf a}_1,\ldots,{\bf a}_k)$ es, efectivamente, tal y como dice el libro. (Creo que ha sido un poco engañoso que la primera parte de la prueba sólo se refiera al caso de que haya exactamente dos $\mathbf{h}_i$ términos).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X