10 votos

Definición del gradiente para coordenadas no cartesianas

El gradiente de una función $f: \mathbb{R}^n \to \mathbb{R}$ se define como el vector de las derivadas parciales:

$$ \nabla f = \left(\frac{\partial f}{\partial x_1}, ..., \frac{\partial f}{\partial x_n}\right)$$

Recientemente, me he confundido un poco con esta definición, ya que me he dado cuenta de que si, por ejemplo, $f$ se define en coordenadas esféricas $(r, \theta, \phi)$ el gradiente viene dado por

$$ \nabla f = \left(\frac{\partial f}{\partial r}, \frac{1}{r} \frac{\partial f}{\partial \theta}, \frac{1}{r \sin \theta} \frac{\partial f}{\partial \phi} \right)$$

en lugar de

$$ \nabla f = \left(\frac{\partial f}{\partial r}, \frac{\partial f}{\partial \theta}, \frac{\partial f}{\partial \phi} \right)$$

Tengo dos preguntas al respecto:

  1. ¿Se sigue considerando que una función de valor escalar en coordenadas esféricas es $f: \mathbb{R}^3 \to \mathbb{R}$ o es $\mathbb{R}^3$ reservado para las coordenadas cartesianas?
  2. ¿La definición de "derivada parcial" del gradiente requiere de hecho coordenadas cartesianas?

11voto

Nathan Bedford Puntos 3157

Resulta que hay dos nociones diferentes pero relacionadas de diferenciación para una función $f:\mathbb R^n\to\mathbb R$ : el derivado total $df$ y el gradiente $\nabla f$ .

  • La derivada total es una covector ("vector dual", "forma lineal") y no depende de la elección de una métrica ("medida de longitud").
  • El gradiente es un vector y derivada de la derivada total, pero depende de una métrica. Por eso tiene un aspecto un poco raro en diferentes sistemas de coordenadas.

La definición de la derivada total responde a la siguiente pregunta: dado un vector $\vec v$ ¿Cuál es la pendiente de la función $f$ en dirección a $\vec v$ ? La respuesta es, por supuesto

$$ df_{x}(\vec v) = \lim_{t\to0} \frac{f(x+t\vec v)-f(x)}{t}$$

Es decir, empiezas en el punto $x$ y caminar un poquito en dirección a $\vec v$ y tome nota de la relación $\Delta f/\Delta t$ .

Obsérvese que la derivada total es un mapa lineal $\mathbb R^n \to \mathbb R$ no es un vector en $\mathbb R^n$ . Dado un vector, te dice algún número. En coordenadas, suele escribirse como

$$ df = \frac{\partial f}{\partial x}dx + \frac{\partial f}{\partial y}dy + \frac{\partial f}{\partial z}dz $$

donde $dx,dy,dz$ son las derivadas totales de las funciones de coordenadas, por ejemplo $dx(v_x,v_y,v_z) := v_x$ . Esta fórmula tiene el mismo aspecto en cualquier sistema de coordenadas.

En cambio, el gradiente responde a la siguiente pregunta: ¿cuál es el dirección de la mayor pendiente ascendente de la función? ¿Qué vector $\vec v$ de longitud de la unidad maximiza la función $df(\vec v)$ ? Como puedes ver, esta definición depende crucialmente del hecho de que puedas medir la longitud de un vector. El gradiente se define entonces como

$$ \nabla f = df(\vec v_{max})\cdot\vec v_{max} $$

es decir, da tanto la dirección como la magnitud del cambio más pronunciado.

También se puede expresar como

$$ \langle \nabla f, \vec v \rangle = df(\vec v) \quad\forall \vec v\in\mathbb R^n.$$

En otras palabras, el producto escalar $\langle,\rangle$ se utiliza para convertir un covector $df$ en un vector $\nabla f$ . Esto significa también que la fórmula del gradiente es muy diferente en sistemas de coordenadas distintos del cartesiano. Si se cambia el producto escalar (por ejemplo, a $\langle\vec a,\vec b\rangle := a_xb_x + a_yb_y + 4a_zb_z$ ), también cambia la dirección del ascenso más pronunciado. (Ejercicio: ¿Por qué?)

4voto

scubabbl Puntos 6776

En cuanto a la primera pregunta, el hecho de que una función sea o no de "valor escalar" no depende del sistema de coordenadas del dominio. Cualquier función que evalúe a un valor en el campo subyacente, en este caso $\mathbb{R}$ es escalar. Sin embargo, a menos que se indique explícitamente lo contrario, la gente suele asumir coordenadas cartesianas con los vectores de base estándar cuando hacen referencia a $\mathbb{R}^n$ .

Su segunda pregunta requiere un poco más de trabajo para responder, pero la respuesta corta es, sí, ya que es normalmente definido, el gradiente se especifica en términos de coordenadas cartesianas, pero hay un enfoque mucho mejor. Recientemente he estado trabajando en material que está directamente relacionado con esto. Véase, por ejemplo, esta pregunta Hace poco lo planteé. La cuestión era la siguiente:

Si $f:X\subset \mathbb{R}^n \rightarrow \mathbb{R}$ entonces la derivada de $f$ en $x_0$ , $df_{x_0}$ es una función lineal $df_{x_0}:\mathbb{R^n} \rightarrow \mathbb{R}$ Por el teorema de la representación de Riesz existe un único vector en $\mathbb{R}^n$ que denotamos por $\nabla f(x_0)$ que satisfaga

$$ df_{x_0}(v) = g(v, \nabla f(x_0)) $$ para cada $v \in \mathbb{R}^n$ y donde $g$ es un producto interno sobre $\mathbb{R}^n$ Nótese que esta definición está libre de coordenadas pero requiere la existencia de un producto interior (que puede ser o no el estándar). Véase por ejemplo [AMANN, p 160] o [FRANKEL, p46] para una discusión de esta perspectiva.

Ahora bien, resulta que si se utilizan vectores de coordenadas cartesianas estándar, entonces se puede recuperar la definición "típica" del gradiente a partir de ésta. Para ver esto, sin embargo, y para ver de dónde viene la expresión para el gradiente en coordenadas esféricas que usted proporcionó en su pregunta, nos obliga a cavar más profundo.

Ahora, se puede demostrar que

$$ \nabla f(x_0) = (g^{1k} \partial_k f(x_0), \dots, g^{nk} \partial f(x_0)) $$

donde $g^{ij}$ denota el $i,j$ entrada de la inversa de la matriz $G = [g_{ij}]$ Le remito de nuevo a mi anterior pregunta para conocer los detalles de esta declaración. Así pues, esta expresión nos da una forma concreta de calcular realmente el gradiente, pero para ello tendremos que averiguar cómo calcular realmente la matriz $G$

Como ejemplo (manejable), consideremos las coordenadas polares. Están relacionadas con las coordenadas cartesianas mediante las conocidas fórmulas $x = r \cos (\theta)$ y $y = r \sin (\theta)$ . Se puede demostrar que la matriz $G$ viene determinada por la relación $G = J^TJ$ donde $J$ es el jacobiano de la transformación en cuestión. Véase [KAY, p54] para una referencia a este hecho.

En el caso de coordenadas polares, la transformación viene dada por $$ T(r,\theta)= (r \cos (\theta), r \sin (\theta)) $$

El jacobiano de la transformación es entonces

$$ J = \bigl( \begin{array}{ccc} \cos (\theta) & -r \sin (\theta) \\ \sin (\theta) & r \cos(\theta) \end{array} \bigr) $$

Tras analizar los detalles, descubrimos que

$$ G = J^TJ = \bigl( \begin{array}{ccc} 1 & 0 \\ 0 & r^2 \end{array} \bigr) $$

Por lo tanto,

$$ G^{-1} = \bigl( \begin{array}{ccc} 1 & 0 \\ 0 & \frac{1}{r^2} \end{array} \bigr) $$

A partir de esta matriz podemos leer $g^{ij}$ de lo que se deduce que

$$ \nabla f(x_0) = (\partial_r f(x_0), \frac{1}{r^2} \partial_{\theta} f(x_0)) $$

Pero aún no hemos terminado. Esta expresión no concuerda con lo que se suele encontrar, que es

$$ \nabla f(x_0) = (\partial_r f(x_0), \frac{1}{r} \partial_{\theta} f(x_0)) $$

donde falta un factor de $r$ en la segunda coordenada. ¿Qué ocurre aquí? En primer lugar, observamos que como estamos trabajando en $r - \theta$ coordenadas, el vector gradiente es relativo a $r - \theta$ bases. Nuestra notación de componentes oculta este hecho. Así que lo que realmente tenemos es

$$ \nabla f(x_0) = \partial_r f(x_0) e_r + \frac{1}{r^2} \partial_{\theta}f(x_0)e_{\theta} $$

donde $e_r$ y $e_{\theta}$ denotan el $r - \theta$ vectores base. ¿Qué son? Bueno, siempre se puede usar la geometría para averiguarlo, pero como yo soy muy malo en geometría, me gusta pensar que se definen analíticamente como vectores tangentes. Ver [KOKS, p 298] para una discusión de esta perspectiva. Para determinarlos sólo tenemos que diferenciar nuestra transformación $T$ con respecto a $r$ y $\theta$ respectivamente. Así,

$$ e_r = \partial_r T = (\cos (\theta), \sin(\theta)) $$

y

$$ e_{\theta} = \partial_{\theta}T = r(-\sin( \theta), \cos (\theta)) $$

Tenga en cuenta, no obstante, que aunque $e_r = \hat{e_r}$ es un vector unitario $e_{\theta}$ no lo es. Utilizando un poco de álgebra vemos que $e_{\theta} = |r|\hat{e_{\theta}}$ . Por lo tanto, el gradiente con respecto al unidad viene dada por

$$ \nabla f(x_0) = \partial_r f(x_0) \hat{e_r} + \frac{1}{r} \partial_{\theta}f(x_0)\hat{e_\theta} $$

y por lo tanto estamos de acuerdo con la expresión común para el gradiente en coordenadas polares.

Referencias:

[AMANN] Amann y Escher, Análisis II

[FRANKEL] Frankel, La Geometría de la Física

[KAY] Kay, Schaum's Outline of Tensor Calculus

[KOKS] Koks, Exploraciones en Física Matemática

0voto

Eduard Wirch Puntos 199

En coordenadas esféricas $f:(0,\infty)\times (0,2\pi]\times [0,\pi]\to \mathbb{R}$ porque el radio tiene que ser positivo, y los otros son los posibles ángulos que puedes elegir.

La segunda pregunta me resulta un poco extraña. Creo que entiendo lo que pregunta. Para mí, esa fórmula que escribiste para el gradiente en coordenadas esféricas en realidad es una definición de "derivada parcial".

Esto es lo que creo que puede estar causando confusión. Cuando se escribe el triple $\nabla f=\left(\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}, \frac{\partial f}{\partial z}\right)$ ese triple significa $\frac{\partial f}{\partial x}\hat{i}+ \frac{\partial f}{\partial y}\hat{j} + \frac{\partial f}{\partial z}\hat{k}$ donde $\hat{i}$ es el vector unitario normalizado $(1,0,0)^T$ etc.

Cuando escribes esa segunda expresión, el triple ya no significa eso. Es decir $\nabla f \neq \frac{\partial f}{\partial r}\hat{i}+\cdots $ . En realidad es en términos de los vectores unitarios estándar en coordenadas esféricas. Así que $$\nabla f= \frac{\partial f}{\partial r}\hat{r} + \frac{1}{r}\frac{\partial f}{\partial \theta}\hat{\theta} + \frac{1}{r\sin\theta}\frac{\partial f}{\partial \phi}\hat{\phi}$$

Estoy bastante seguro de que si escribes lo que significan todas estas cosas usando las fórmulas de cambio de coordenadas y algunas reglas de encadenamiento deberías conseguir que las dos sean equivalentes, pero será bastante tedioso.

Sigo pensando que en realidad no he respondido a tu pregunta, así que quizá otra persona tenga una explicación mejor...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X