25 votos

¿Por qué la derivada generalizada tiene que ser una transformación lineal?

Estoy empezando a aprender Análisis Real y me he encontrado con la definición generalizada de la derivada para dimensiones superiores. Me doy cuenta de que el hecho de que la derivada sea una transformación lineal se ajusta bien al caso unidimensional en el que la derivada es simplemente una constante en cualquier punto. También entiendo que no puede ser tan simple como la multiplicación por una constante para las dimensiones superiores, ya que se puede acercar a un punto a lo largo de múltiples curvas en las dimensiones superiores. Pero, ¿de dónde sacamos que tiene que ser lineal? ¿Por qué no podría ser otro tipo de función? Me gustaría obtener una explicación intuitiva.

14 votos

La explicación intuitiva podría venir del hecho de que la derivada en una dimensión es la pendiente de la recta tangente a la gráfica en el punto dado. Generalizando, se obtiene que la derivada debe dar el plano tangente a la gráfica de la función en ese punto.

24voto

Joel Puntos 101

No tiene por qué ser así: queremos que lo sea.

Es un definición que la derivada es un mapa lineal. Así que la pregunta es más bien "¿Por qué la noción de aproximación lineal es tan interesante, que merece un lugar tan central?". La respuesta es que los mapas lineales son bastante sencillos de entender, a la vez que son bastante generales.

Si se eligen aproximaciones más sencillas, por ejemplo, sólo se permiten mapas de la forma $x\mapsto \lambda*x$ para algún escalar $\lambda$ como "derivadas", muchas funciones dejarían de ser "diferenciables".

Si se eligen mapas más complicados, por ejemplo, se permiten mapas como $x\mapsto Ax + B|x|$ con un valor absoluto por componentes (por lo que la "derivada" sería un par $(A,B)$ ), tendrá algunas funciones más "diferenciables", pero no está nada claro cómo esta noción será de ayuda.

Así, los mapas lineales parecen ser un equilibrio perfecto entre simplicidad y generalidad. Esto se ve en acción, por ejemplo, si se ve en acción el método de Newton en dimensión superior o se analizan sistemas no lineales de ecuaciones diferenciales mediante sus linealizaciones locales.

(Otro aspecto: Para las funciones de una variable compleja hay dos nociones de diferenciabilidad. Se puede considerar real linealidad que da la diferenciabilidad en el sentido de los mapeos del espacio real bidimensional a sí mismo. La otra posibilidad es considerar complejo linealidad y esto conduce a funciones holomorfas. Esto da mucha rigidez adicional y conduce a una noción de derivada más restrictiva pero también poderosa).

15voto

Open Ball Puntos 406

A continuación se explora cómo se podría generalizar la noción de diferenciabilidad partiendo de la $\epsilon-\delta$ definición.

Si $f$ es una función de valor real de una sola variable real, recordemos que $f$ es diferenciable en $a$ si existe $L \in \Bbb R$ tal que para todo $\epsilon >0$ existe $\delta > 0$ tal que para $|h| < \delta$ uno tiene:

$$|f(a+h) -f(a) - Lh| < \epsilon |h|$$

Ahora supongamos que $f$ toma sus valores en un espacio vectorial normado $F$ pero sigue siendo una función de una sola variable real. Esencialmente, la misma definición debería funcionar, excepto que tenemos que sustituir $|\cdot|$ por $\|\cdot\|$ y que $L$ tiene que ser un elemento de $F$ esta vez.

Pero si $f: E \to F$ , donde $E$ y $F$ son espacios vectoriales normados, nos encontramos con el problema de generalizar adecuadamente el producto $Lh$ . $h$ es un elemento de $E$ y $Lh$ debe ser un elemento de $F$ , por lo que la única manera $Lh$ tendría sentido si $L$ es una función $E \to F$ .

Ahora bien, ¿por qué debería ser lineal? ¿Y mucho menos continua?

La linealidad se debe a que queremos resolver el siguiente problema: ¿qué garantiza la unicidad de $L$ ? Si no es única, toda la definición no tendría sentido; no nos diría nada interesante. Siempre podríamos adaptar una función específica $E \to F$ que satisface la definición, digamos $L: h \mapsto f(a+h) -f(a)$ . Por lo tanto, nuestra misión es encontrar un clase de funciones para incluir $L$ de manera que se pueda garantizar la unicidad de tal $L$ .

Supongamos que $L_1$ y $L_2$ son funciones $E \to F$ ambos satisfactorios:

$$(\forall \epsilon > 0)(\exists \delta >0)(\forall h \in E, \|h\| < \delta \implies \|f(a+h)-f(a) -L h\| < \epsilon \|h\|) \tag 1$$

En otras palabras, $f(a+h) - f(a) = L_i h + o(h)$ . Como resultado, obtenemos $L_1 h - L_2 h = o(h)$ es decir $Lh = o(h)$ , donde $L = L_1 - L_2$ . La pregunta es:

¿Qué condiciones deben $L$ satisfacen para que $Lh = o(h) \implies L=0$ ?

Una opción obvia es: $L$ es lineal. Porque si es así, dejemos que $\epsilon > 0$ sea arbitraria. Entonces, existe $\delta > 0$ tal que $\|h\| < \delta \implies \|Lh\| < \epsilon \|h\|$ . Para $z\neq 0$ , elija $h = \frac{\delta}{2 \|z\|} z$ para que $\|h\| < \delta$ y obtenemos tras la simplificación de $\|Lh\| < \epsilon \|h\|$ que $\|Lz\| < \epsilon \|z\|$ . En particular, $L$ está acotado y $\|L\| < \epsilon$ para todos $\epsilon >0$ Así que $\|L\| = 0$ y así $L = 0$ .

Para $L$ para ser lineal, es razonable tener $L_1$ y $L_2$ ambos lineales porque fueron elegidos arbitrariamente. Por lo tanto, esperaríamos que el $L$ en $(1)$ sea lineal. Ahora todavía no habíamos resuelto el problema de por qué $L$ debe ser continua. La continuidad se debe a que queremos resolver el siguiente problema:

¿Garantiza esta definición de diferenciabilidad que la diferenciabilidad implica continuidad?

Lo primero que hacemos es utilizar $|\|a\| - \|b\| | \le \|a-b\|$ en $(1)$ para conseguirlo:

$$\|f(a+h) - f(a)\| < \epsilon \|h\| + \|Lh\|$$

Si $L$ no es continua, no podemos controlar $\|Lh\|$ (no podemos hacerlo tan pequeño como queremos), así que $f$ puede no ser continua en $a$ . Sin embargo, si $L$ es continua, entonces:

$$\|f(a+h) - f(a)\| < (\epsilon + \|L\|) \|h\|$$

y esto da $\lim_{h\to 0} f(a+h) = f(a)$ es decir $f$ es continua en $a$ .

Por lo tanto, obtenemos la siguiente definición.

Dejemos que $E$ y $F$ sean dos espacios vectoriales normados, $f: E \to F$ y $a \in E$ . Decimos que $f$ es diferenciable en $a$ si existe un mapa lineal continuo $L: E \to F$ tal que..:

$$(\forall \epsilon > 0)(\exists \delta >0)(\forall h \in E, \|h\| < \delta \implies \|f(a+h)-f(a) -L h\| < \epsilon \|h\|)$$

Continuidad de $L$ no está incluida en la definición de diferenciabilidad de funciones $\Bbb R^n \to \Bbb R^m$ porque en los espacios vectoriales normados de dimensión finita, obtenemos la continuidad de $L$ gratis.

1 votos

"porque en dimensión finita obtenemos que L es continua de forma gratuita" ¿puede elaborar, o tal vez sólo mencionar un teorema / wikipage.

0 votos

0 votos

@Olba12 ¡gracias!

8voto

Vik78 Puntos 16

Dejemos que $f, g : \Bbb{R}^n \to \Bbb{R}$ sea diferenciable en un punto $p$ . Geométricamente, la idea de la derivada $f'(p)$ es que te dice la línea tangente, el plano tangente o $n$ -equivalente a la gráfica de $f$ en $p$ . En un barrio de $p$ la función "se parece" al espacio tangente en $p$ . Si se parametrizan dos líneas o planos y se suman las parametrizaciones, se obtiene otra línea o plano, y lo mismo si se multiplica una de sus parametrizaciones por un escalar. Como $f$ y $g$ localmente se parecen mucho a sus espacios tangentes en $p$ y la derivada es esencialmente la función que te dice cuál es el espacio tangente, deberías esperar que la derivada se comporte de la misma manera con respecto a su suma y múltiplos escalares que en sus espacios tangentes parametrizados.

6voto

user21820 Puntos 11547

Voy a dar una razón muy intuitiva y no rigurosa.

La derivada capta el significado de las tasas relativas de cambio de las variables cerca de algún punto. Lo que esto significa efectivamente es que cuando se acerca a ese punto, la superficie de la restricción se acerca cada vez más a ser un (hiper)plano. Esto es especialmente así cuando queremos la tasa de cambio de alguna variable dependiente con respecto a múltiples variables independientes, ya que esperamos que cambie suavemente con respecto a cada variable independiente. Si nos acercamos lo suficiente, todos los requisitos de suavidad individual implicarán que la variable dependiente varía linealmente con respecto a las variables independientes cerca del punto considerado.

0 votos

Esta razón (más propia de las ciencias físicas, donde las cosas siempre cambian suavemente) también ayuda a apoyar Dirk de la respuesta "queremos que sea así".

0 votos

Has dado la respuesta en un cuadro de "cita". ¿Es una cita de algún sitio?

1 votos

@Wildcard: No. Es completamente mía y es como explico la noción de diferenciación a los alumnos. No me apetece introducir ni siquiera el caso 1d usando la - definición, porque surge de la noción intuitiva y debe venir después de uno sabe lo que quiere.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X