11 votos

regla de la cadena utilizando el diagrama de árbol, ¿por qué funciona?

En el cálculo multivariable, me enseñaron a calcular la regla de la cadena dibujando un "diagrama de árbol" (un gráfico acíclico dirigido) que representa la dependencia de una variable con respecto a las demás. Ahora quiero entender la teoría que hay detrás.

Ejemplos: Que $y$ et $x$ ambos sean funciones de $t$ . Sea $z$ sea una función de ambos $x$ et $y$ .

La derivada de z con respecto a t es: $$\frac{dz}{dt} = \frac{\partial z}{\partial x} \frac{dx}{dt} + \frac{\partial z}{\partial y} \frac{dy}{dt}$$

Para calcular esta derivada, me enseñaron a dibujar un gráfico con las siguientes aristas: $x \to z$ , $y \to z$ , $t \to x$ y $t \to y$ . Fuente: http://www.math.hmc.edu/calculus/tutorials/multichainrule/

alt text

Estos diagramas de árbol pueden construirse para funciones arbitrariamente complejas con muchas variables.

En general, para encontrar la derivada de una variable dependiente con respecto a una variable independiente, hay que tomar la suma de todos los caminos diferentes para llegar a la variable dependiente desde la variable independiente. Al recorrer un camino, se multiplican las funciones (por ejemplo $\frac{\partial z}{\partial x} \cdot \frac{dx}{dt}$ ).

¿Por qué funciona esto?

8voto

Matt Dawdy Puntos 5479

El objetivo de las derivadas en una variable es proporcionar aproximaciones lineales $f(x) = f(p) + f'(p) (x - p) + o(|x - p|)$ a funciones agradables. Las derivadas multivariantes funcionan de la misma manera, excepto que "aproximación lineal" significa aquí la aproximación por una transformación lineal general (una matriz) en lugar de un escalar.

Esto se precisa con la siguiente definición: decimos que una función $f : \mathbb{R}^n \to \mathbb{R}^m$ tiene derivado total una transformación lineal $df_p : \mathbb{R}^n \to \mathbb{R}^m$ en un punto $p$ si existe $\epsilon > 0$ y una función $E_p(h)$ definido para $|h| < \epsilon$ tal que

$$f(p + h) = f(p) + df_p(h) + |h| E_p(h)$$

donde $\lim_{h \to 0} E_p(h) = 0$ . La matriz $df_p$ a veces se denomina Jacobiano . En notación little-o escribimos esto

$$f(p + h) = f(p) + df_p(h) + o(|h|).$$

Esto puede parecer innecesariamente complicado, pero es la clave para entender la regla de la cadena multivariante. Supongamos que además de $f$ tenemos otra función $g : \mathbb{R}^m \to \mathbb{R}^k$ con una derivada total $dg_q$ en algún momento $q$ y supongamos que $f(p) = q$ . Entonces

$$gf(p + h) = g \left( f(p) + df_p(h) + o(|h|) \right) = gf(p) + dg_q df_p(h) + o(|h|)$$

o, en otras palabras,

La derivada total $d(gf)_p$ de $gf$ en $p$ es el producto (matricial) de las derivadas totales $dg_q$ et $df_p$ .

Este es el enunciado más general de la regla de la cadena multivariante. La relación con los diagramas de árbol es que se puede modelar la multiplicación de matrices mediante la composición de matrices de incidencia que provienen de los gráficos que representan las relaciones de incidencia entre los conjuntos.

En tu ejemplo particular, tienes una función $t \mapsto (x, y) : \mathbb{R}^1 \to \mathbb{R}^2$ y otra función $(x, y) \mapsto z : \mathbb{R}^2 \to \mathbb{R}^1$ . La derivada total de la primera función es $\left[ \begin{array}{c} \frac{dx}{dt} \\\ \frac{dy}{dt} \end{array} \right]$ y la derivada total de la segunda función es $\left[ \frac{dz}{dx}, \frac{dz}{dy} \right]$ por lo que la derivada total de su composición es el producto

$$\frac{dz}{dt} = \left[ \frac{dz}{dx}, \frac{dz}{dy} \right] \left[ \begin{array}{c} \frac{dx}{dt} \\\ \frac{dy}{dt} \end{array} \right]$$

y esta es precisamente la fórmula que das. La conexión con los diagramas es que se puede representar una composición de transformaciones lineales $\mathbb{R}^1 \to \mathbb{R}^2$ et $\mathbb{R}^2 \to \mathbb{R}^1$ utilizando un par de matrices de incidencia, una para representar las incidencias entre un $1$ -y un conjunto de elementos $2$ -conjunto de elementos, y el otro para representar las incidencias entre ese $2$ -conjunto de elementos y otro $1$ -conjunto de elementos.

3voto

Simon Nickerson Puntos 17147

Piensa en la diferenciación como las derivadas a lo largo de diferentes ejes.

Así que lo que tienes es en esencia $\frac{dz}{dt} = \frac{\partial z}{\partial x}|_y \frac{dx}{dt}+ \frac{\partial z}{\partial y}|_x \frac{dy}{dt}$

La suma existe cuando no estás viajando en ninguno de esos ejes, entonces estás viajando a lo largo de un camino que es "compartido" por los dos ejes, y su suma te dice el gradiente de ese camino.

1voto

Gamma Function Puntos 2405

Este video seguramente aclarará las cosas: http://www.youtube.com/watch?v=2bF6H_xu0ao .

Aunque puede llevar un poco más de tiempo, personalmente encuentro que calcular el diferencial total es sustancialmente más fácil y más intuitivo que un diagrama de árbol.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X