50 votos

¿Demostración intuitiva de la fórmula de cambio de variables multivariable (jacobiana) sin utilizar la teoría de mapas y/o medidas?

¿Cuál es una prueba intuitiva de la fórmula de cambio de variables multivariable (jacobiana) sin utilizar la teoría de mapas y/o de medidas?

Creo que los libros de texto complican demasiado la prueba.

Si es posible, utiliza el álgebra lineal y el cálculo para resolverlo, ya que eso sería lo más sencillo de entender para mí.

1 votos

Si hubiera una prueba más sencilla, ¿no crees que los libros la utilizarían?

1 votos

@Potato - ¿No podría el autor dar también las intuiciones?

0 votos

¿Qué quieres exactamente? Una prueba diferente, o una explicación intuitiva de la prueba estándar (digamos, la que está en Folland).

58voto

Dan Puntos 381

Hacerlo para un número determinado de variables es muy fácil de seguir. Considera lo que haces cuando integras una función de x e y sobre alguna región. Básicamente, se corta la región en cajas de área ${\rm d}x{~\rm d} y$ Para evaluar la función en un punto de cada caja, multiplícala por el área de la caja. Esto puede ser anotado un poco descuidado como:

$$\sum_{b \in \text{Boxes}} f(x,y) \cdot \text{Area}(b)$$

Lo que se hace al cambiar las variables es trocear la región en cajas que no son rectangulares, sino que se trocea a lo largo de líneas que están definidas por alguna función, llámese $u(x,y)$ , siendo constante. Por lo tanto, digamos que $u=x+y^2$ , esto sería todas las parábolas $x+y^2=c$ . A continuación, se hace lo mismo con otra función, $v$ , digamos que $v=y+3$ . Ahora, para evaluar la expresión anterior, es necesario encontrar el "área de la caja" para las nuevas cajas - no es ${\rm d}x~{\rm d}y$ más.

Como las cajas son infinitesimales, los bordes no pueden ser curvos, por lo que deben ser paralelogramos (líneas adyacentes de constante $u$ o constante $v$ son paralelos). Los paralelogramos están definidos por dos vectores: el vector resultante de un pequeño cambio en $u$ y la resultante de un pequeño cambio en $v$ . En forma de componentes, estos vectores son ${\rm d}u\left\langle\frac{\partial x}{\partial u}, ~\frac{\partial y}{\partial u}\right\rangle $ y ${\rm d}v\left\langle\frac{\partial x}{\partial v}, ~\frac{\partial y}{\partial v}\right\rangle $ . Para ver esto, imagina que te mueves una pequeña distancia ${\rm d}u$ a lo largo de una línea de constante $v$ . ¿Cuál es el cambio en $x$ cuando cambias $u$ pero manténgase $v$ ¿constante? El parcial de $x$ con respecto a $u$ , tiempos ${\rm d}u$ . Lo mismo ocurre con el cambio de $y$ . (Obsérvese que esto implica escribir $x$ y $y$ como funciones de $u$ , $v$ y no al revés. La condición principal de un cambio de variables es que ambos sentidos sean posibles).

El área de un paralelograma delimitada por $\langle x_0,~ y_0\rangle $ y $\langle x_1,~ y_1\rangle $ es $\vert y_0x_1-y_1x_0 \vert$ (o el valor abs del determinante de una matriz de 2 por 2 formada al escribir los dos vectores columna uno al lado del otro).

$$\left\vert\frac{\partial x}{\partial u}{\rm d}u\frac{\partial y}{\partial v}{\rm d}v - \frac{\partial y}{\partial u}{\rm d}u\frac{\partial x}{\partial v}dv\right\vert$$

o

$$\left\vert \frac{\partial x}{\partial u}\frac{\partial y}{\partial v} - \frac{\partial y}{\partial u}\frac{\partial x}{\partial v}\right\vert~{\rm d}u~{\rm d}v$$

que reconocerá como $\mathbf J~{\rm d}u~{\rm d}v$ , donde $\mathbf J$ es el jacobiano.

Así que, volviendo a nuestra expresión original

$$\sum_{b \in \text{Boxes}} f(x,y) \cdot \text{Area}(b)$$

se convierte en

$$\sum_{b \in \text{Boxes}} f(u, v) \cdot \mathbf J \cdot {\rm d}u{\rm d}v$$

donde $f(u, v)$ es exactamente equivalente a $f(x, y)$ porque $u$ y $v$ puede escribirse en términos de $x$ y $y$ y viceversa. A medida que el número de cajas llega al infinito, esto se convierte en una integral en la $uv$ avión.

Para generalizar a $n$ variables, todo lo que necesita es que el área/volumen/equivalente del $n$ caja dimensional sobre la que se integra es igual al valor absoluto del determinante de una matriz de n por n de derivadas parciales. Esto es difícil de demostrar, pero fácil de intuir.


*Para demostrarlo, toma dos vectores de magnitudes $A$ y $B$ , con ángulo $\theta$ entre ellos. Entonces escríbelas en una base tal que una de ellas apunte a una dirección específica, por ejemplo

$$A\left\langle \frac{1}{\sqrt 2}, \frac{1}{\sqrt 2}\right\rangle \text{ and } B\left\langle \frac{1}{\sqrt 2}(\cos(\theta)+\sin(\theta)),~ \frac{1}{\sqrt 2} (\cos(\theta)-\sin(\theta))\right\rangle $$

Ahora realice la operación descrita anteriormente y obtendrá $$\begin{align} & AB\cdot \frac12 \cdot (\cos(\theta) - \sin(\theta)) - AB \cdot 0 \cdot (\cos(\theta) + \sin(\theta)) \\ = & \frac 12 AB(\cos(\theta)-\sin(\theta)-\cos(\theta)-\sin(\theta)) \\ = & -AB\sin(\theta) \end{align}$$

El valor absoluto de esto, $AB\sin(\theta)$ Así es como se halla el área de un paralelogramo: los productos de las longitudes de los lados por el seno del ángulo entre ellos.

48voto

littleO Puntos 12894

La fórmula de cambio de variables multivariable es muy intuitiva, y no es muy difícil imaginar cómo alguien podría haber derivado la fórmula desde cero. Sin embargo, parece que demostrar el teorema de forma rigurosa no es tan fácil como cabría esperar.

Aquí está mi intento de explicar la intuición - cómo se derivaría o descubriría la fórmula.

Lo primero que hay que entender es que si $A$ es un $N \times N$ con entradas reales y $S \subset \mathbb R^N$ entonces $m(AS) = |\det A| \, m(S)$ . (Técnicamente debería asumir que $S$ es medible). Esto se deduce intuitivamente del SVD de $A$ : \begin{equation} A = U \Sigma V^T \end{equation} donde $U$ y $V$ son ortogonales y $\Sigma$ es diagonal con entradas diagonales no negativas. Multiplicando por $V^T$ no cambia la medida de $S$ . Multiplicando por $\Sigma$ escalas a lo largo de cada eje, por lo que la medida se multiplica por $\det \Sigma = | \det A|$ . Multiplicando por $U$ no cambia la medida.

Supongamos que el siguiente $\Omega$ y $\Theta$ son subconjuntos abiertos de $\mathbb R^N$ y supongamos $g:\Omega \to \Theta$ es $1-1$ y sobre. Probablemente deberíamos asumir $g$ y $g^{-1}$ son $C^1$ sólo para estar seguros. (Dado que sólo buscamos una derivación intuitiva de la fórmula de cambio de variables, no estamos obligados a preocuparnos demasiado por las suposiciones que hacemos sobre $g$ .) Supongamos también que $f:\Theta \to \mathbb R$ es, digamos, continua (o cualquier condición que necesitemos para que el teorema sea realmente cierto).

Partición $\Theta$ en pequeños subconjuntos $\Theta_i$ . Para cada $i$ , dejemos que $u_i$ sea un punto en $\Theta_i$ . Entonces \begin{equation} \int_{\Theta} f(u) \, du \approx \sum_i f(u_i) m(\Theta_i). \end{equation}

Ahora dejemos que $\Omega_i = g^{-1}(\Theta_i)$ y $x_i = g^{-1}(u_i)$ para cada $i$ . Los conjuntos $\Omega_i$ son minúsculos y hacen una partición $\Omega$ . Entonces \begin{align} \sum_i f(u_i) m(\Theta_i) &= \sum_i f(g(x_i)) m(g(\Omega_i)) \\ &\approx \sum_i f(g(x_i)) m(g(x_i) + Jg(x_i) (\Omega_i - x_i)) \\ &= \sum_i f(g(x_i)) m(Jg(x_i) \Omega_i) \\ &\approx \sum_i f(g(x_i)) |\det Jg(x_i)| m(\Omega_i) \\ &\approx \int_{\Omega} f(g(x)) |\det Jg(x)| \, dx. \end{align}

Hemos descubierto que \begin{equation} \int_{g(\Omega)} f(u) \, du \approx \int_{\Omega} f(g(x)) |\det Jg(x)| \, dx. \end{equation} Utilizando subconjuntos aún más pequeños $\Theta_i$ la aproximación sería aún mejor -- por lo que vemos por un argumento limitante que realmente tenemos la igualdad.

En un paso clave del argumento anterior, utilizamos la aproximación \begin{equation} g(x) \approx g(x_i) + Jg(x_i)(x - x_i) \end{equation} que es una buena aproximación cuando $x$ está cerca de $x_i$

3 votos

¿Puede comentar qué hace más difícil la prueba rigurosa?

3 votos

Si no puedes explicárselo a un niño de seis años, es que tú mismo no lo entiendes" ALBERT EINSTEIN

0 votos

Esto es encantador. Gracias.

5voto

Mike Puntos 11

Una larga demostración de la fórmula de cambio de variables para las integrales de Riemann en $\mathbb R^n$ (que no utiliza la teoría de la medida) se da en Cálculo vectorial, álgebra lineal y formas diferenciales: Un enfoque unificado por Hubbard y Hubbard. En la página 493 se analiza la intuición en la que se basa.

3voto

Muphrid Puntos 12245

Sea una función vectorial $f(x) = x'$ que puede interpretarse como una reubicación de puntos o un cambio de coordenadas. Por ejemplo, $f(x) = \sqrt{x \cdot x} e_1 + \arctan \frac{x^2}{x^1} e_2$ reasigna las coordenadas cartesianas $x^1, x^2$ a coordenadas polares en los vectores base $e_1, e_2$ .

Ahora, dejemos que $c(\tau)$ sea un camino parametrizado por el parámetro escalar $\tau$ . Sea $f(c) = c'(\tau)$ sea la imagen de este camino bajo la transformación. La regla de la cadena nos dice que

$$\frac{dc'}{d\tau} = \Big(\frac{dc}{d\tau} \cdot \nabla \Big) f$$

Definir $a \cdot \nabla f \equiv \underline f(a)$ como el Jacobiano operador que actúa sobre un vector $a$ y la ecuación puede reescribirse como

$$\frac{dc}{d\tau} = \underline f^{-1} \Big(\frac{dc'}{d\tau} \Big)$$

(Nótese que los primos se han intercambiado, por lo que utilizamos el jacobiano inverso).

Esto es todo lo que necesitamos para demostrar que una integral de línea en las coordenadas originales está relacionada con una integral de línea en las nuevas coordenadas utilizando el Jacobiano. Para algún campo escalar $\phi$ , si $\phi(x) = \phi'(x')$ entonces

$$\int_c \phi \, d\ell = \int_{c'} \phi' \, \underline f^{-1}(d\ell')$$

porque $d\ell'$ se puede convertir en $\frac{d\ell'}{d\tau} \, d\tau$ .

Edición: no vi la palabra intuitivo . En cuanto a las explicaciones intuitivas, se puede pensar en una transformación de coordenadas así. Imagina que las líneas de un sistema de coordenadas polares se deforman y estiran para que se conviertan en rectangulares. Esto facilita el trabajo con ellas, pero como las formas de las líneas de coordenadas, las trayectorias y las áreas han cambiado (y como no se quiere que cambien el resultado, ya que el cambio de coordenadas no debería cambiar el resultado), los errores ingenuos introducidos deben corregirse con un factor del operador jacobiano.

0 votos

"Que haya alguna función vectorial f(x)=x, interpretada como reubicación de puntos o cambio de coordenadas" puedes explicar esto. Claramente x y x ' son vectores, pero cuando dices cambiar coordenadas estás fijando el punto y cambiando los ejes de coordenadas, (o fijando los ejes y moviendo los puntos). Y a qué te refieres con "remaps" y los vectores base e1,e2. Una imagen podría ser ilustrativa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X