15 votos

¿Por qué es el gradiente en la dirección de subida, pero no descenso?

Entiendo que la diferenciación de una función ($\mathbb{R} \rightarrow \mathbb{R} $) en un punto es la tasa de cambio en la salida de un leve empujón en la entrada. Y esta tasa de cambio puede ser positivo o negativo. No existe el concepto de dirección para la única función de variable, así de claro.

Ahora, mi duda es en el caso de la función multivariante ( $\mathbb{R}^n \rightarrow \mathbb{R}$ ), donde la diferenciación es un gradiente. Y este gradiente representa diferenciación parcial w.r.t. para cada base se convierte en una dirección. Esta dirección es una dirección de ascenso, pero no descenso, ¿por qué?. Por qué es una dirección es de ascenso. Mi pregunta no es en absoluto relacionados con la subida más empinada, acerca de lo que uno puede encontrar muchas respuestas en este foro y leer detalladamente en este enlace. Una explicación intuitiva de que sería preferible que la matemática en este enlace.

22voto

M. Winter Puntos 1070

Los comentarios que me indujo a reformular mi respuesta. Para el original (siendo la correcta, pero la sub-óptimo) de la versión, consulte a continuación.

El gradiente se define de una manera completamente natural. No es completamente la razón matemática, por lo que puede ser dicho para que apunte a la subida más empinada. Que tiene que ver más con algo más o menos arbitrario de las decisiones tomadas en los diferentes definiciones, que se rompen esta simetría.

De la observación. El concepto de "gradiente apunta en la dirección de ascenso" también funciona para un solo valor de las funciones de $\Bbb R\to\Bbb R$. De hecho, hay un concepto de dirección en $\Bbb R$: a la derecha y a la izquierda. Un positivo derivado es un vector (la pendiente) que apunta hacia la derecha (en la dirección de subida), un negativo derivado es un vector que apunta hacia la izquierda (en este caso, también la dirección de ascenso, debido a que la función es decreciente a la derecha). Así, desde la misma observación se aplica también en 1D, debemos empezar a buscar una explicación aquí.

Nota: voy a usar los términos "derecha" e "izquierda" para la dirección de "positivo" y "negativo" en el número de la línea, debido a que esta es la orientación estándar del número de línea. Esta es también una simetría descanso, pero sólo una anotación. No efecto de las matemáticas de cualquier forma si se flip estas instrucciones.

Gracias a los comentarios, de algunas definiciones, puede ser localizada como la causa-raíz de la ruptura de la simetría. Si usted está de pie en un lado de la montaña, no hay sentido en la pregunta si es cuesta arriba o cuesta abajo. Esta pregunta sólo tiene sentido si se define una dirección con respecto a la cual se le debe juzgar a la pendiente. Lo mismo va para un solo valor de las funciones. Ha sido un estándar para llamar a una función creciente si la función de gráfico es cuesta arriba a la derecha. Esto implica dos opciones arbitrarias:

  1. El $y$-eje está apuntando hacia arriba, por lo tanto el aumento de los valores de la función son vistos como va para arriba. Este es el más obvio es una elección arbitraria. Muchas de las aplicaciones de hacerlo de la otra manera, por ejemplo, la línea de números en el texto son el aumento de la parte superior a la parte inferior, y los píxeles en una pantalla son generalmente dirigidos con una baja-aumento de la $y$-eje.
  2. El tipo de pendiente es de juzgado w.r.t. a la "arbitraria" la dirección "correcta". Por qué no se queda? Parece natural, pero no obliga.

No podría ser de otra elección arbitraria: un positivo derivado indica que la función es creciente. Lo podríamos haber definido la otra manera alrededor. De todos modos, el volteo de una sola de estas definiciones se cambio el gradiente apunta hacia arriba, apuntando hacia abajo.

Nota. Sí, lo sé, "aumentar" se define formalmente como $x\le y\implies f(x)\le f(y)$, pero también esta definición está motivado por la visualización de un aumento de la función de la gráfica de la derecha. No se podría usar si el $y$-eje apuntando hacia abajo.

Conclusión: La razón para que el gradiente apunta a la subida más empinada se basa en nuestro algo sesgada definiciones. Esto es especialmente evidente en la 1D-caso. La derivada está definida de tal manera que tiene un valor positivo (el gradiente de puntos a la derecha) si la función se incrementa. Una función es llamada creciente si su función de gráfico es el que va cuesta arriba a la derecha. Se puede ver cómo estas definiciones arbitrarias se combinan para "gradiente apunta cuesta arriba".


ORIGINAL

Porque tenemos de alguna manera sesgada definición de la diferenciación. Me explico.

Como se señaló en un comentario, esta "gradiente apunta en la dirección de ascenso" también funciona para un solo valor de las funciones de $\Bbb R\to\Bbb R$. De hecho, hay un concepto de dirección en $\Bbb R$: izquierda y derecha. Un positivo derivado es un vector (la pendiente) que apunta hacia la derecha (en la dirección de subida), un negativo derivado es un vector que apunta hacia la izquierda (también en la dirección de ascenso, debido a que la función es decreciente). Así, desde la misma observación que ocurre en $1$D, probablemente deberíamos empezar por ahí en busca de una respuesta.

Todo esto sucede porque la definición de derivada es sesgada en algún sentido. Alguien una vez decidido que una función se considera aumentar si su valor se hace más grande a la derecha. Usted ve la ruptura de la simetría? Por qué a la derecha, ¿por qué no a la izquierda? Así que una vez que uno ha decidido que la derivada es positiva $-$ el gradiente de puntos a la derecha $-$ cuando la función crece a la derecha. Aquí la tenemos. Quien la definió, directamente acoplados a los términos "dirección del gradiente de la" y ", la dirección de acsent".

Él había decidido definir una función como el aumento de su valor crece a la izquierda (no natural, teniendo en cuenta nuestra izquierda-a-derecha en la dirección de lectura), entonces el gradiente se apunte a la más empinada decente.

Nota: En esta respuesta que supone que el número de la línea está orientado con el número positivo a la derecha. Esta es la norma, pero otra simetría break (pero sólo una anotación, sin impacto en las matemáticas). Puede sustituir a la izquierda/derecha arriba por el negativo/positivo si quieres ser independiente de esta ruptura de la simetría.

5voto

Bram28 Puntos 18

El gradiente con respecto a alguna variable de entrada indica cuánto el valor de la variable de salida que sube (es decir, asciende a) cuando la variable de entrada. Como tal, si usted se mueve en la dirección del gradiente, y la pendiente es positiva, entonces el valor de la variable de salida. Si la pendiente es negativa, sin embargo, el incremento de la variable de entrada disminuirá la variable de salida. Pero sí, un gradiente positivo significa que usted va a ascender si 'seguir' el gradiente.

Esta es nuestra definición de pendientes o laderas, y funciona de la misma en $\mathbb{R}$$\mathbb{R}^n$. Es decir, cuando tomamos la derivada, la derivada $\frac{dy}{dx}$ indica en qué medida $y$ aumenta a medida $x$ aumenta el cual, por cierto, es el mismo como la medida en que $y$ disminuye en la medida en $x$ disminuye.

Ahora, algunas respuestas sugieren que cuando se define el gradiente de esta manera hubo un poco de 'arbitrariedad', y que podríamos haber definido el gradiente de manera diferente, por lo que el sentido inverso. Incluso se sugirió que esto tiene algo que ver con el "derecho" a ser elegido de forma arbitraria como la dirección ascendente y la 'izquierda' ser 'abajo'.

Sin embargo, estoy en desacuerdo con esas respuestas, porque la alternativa habría sido decir que la pendiente sería la medida en que lo medida de lo $y$ aumenta como $x$ disminuye .. que sería muy confuso y poco natural; es como poner en una extraña negativa o revocación.

De todos modos, cuando se desea que el valor de salida a descender, usted debe ir en el 'otro' dirección del gradiente, es decir, restar un valor proporcional al gradiente. Por supuesto, eso significa que si la pendiente es negativa, se termina el aumento de la variable de entrada con el fin de disminuir la variable de salida.

5voto

Eric Towers Puntos 8212

"No existe el concepto de dirección para la única función de variable, así de claro."

Falso.

Cuando la univariante derivada es positiva, la función se incrementa en la dirección de aumentar la entrada; cuando es negativo, en el sentido de la disminución de la entrada. Sólo hay dos direcciones posibles, pero sea lo que sea, la derivada no apuntan en la dirección en la que la función se incrementa.

3voto

DuckStalker Puntos 1

Una definición más general de los "derivados", que sería "la función lineal $L(a) = f'(x)$ que mejor se aproxima a $f(a+x)$ pequeña $a$".

Para una función de $\mathbb{R}\rightarrow\mathbb{R}$ esta función lineal es también de $\mathbb{R}\rightarrow\mathbb{R}$.

Podemos identificar las funciones lineales $\mathbb{R}\rightarrow\mathbb{R}$ con un punto en $\mathbb{R}$ señalando $L(a) = ka$ para algunas constantes $k$.

Podríamos, si elegimos, definir $L(a) = -ka$ o $L(a) = \pi k a$ o $L(a) = ae^k$ tan fácilmente y obtener una $k$. La más fácil recogemos termina haciendo algunas de las matemáticas más fácil, además de que conseguir la adición de los derivados correspondientes a la suma de escalares asociamos con ellos y hasta la multiplicación de trabajo.

Cuando tomamos esta definición y se extienden a $\mathbb{R}^n \rightarrow \mathbb{R}$ o $\mathbb{R} \rightarrow \mathbb{R}^m$ $\mathbb{R}^n \rightarrow \mathbb{R}^m$ todavía podemos obtener derivados ser linaer funciones, pero ahora entre los diferentes espacios.

Estas funciones lineales se pueden asignar a las matrices, y en algunos casos los vectores. Si esta asignación es lineal, esta asignación depende de su elección de la base.

Trabajar con vectores y matrices es a menudo más fácil que trabajar con un resumen de derivados. Así que elige una base que hace que el resto de las matemáticas funcionan mejor.

Dado $f: \mathbb{R}^n \rightarrow \mathbb{R}$, obtenemos $L(a) = f'(x)$ como la mejor aproximación lineal a $f(a+x)$, también conocido como

$$f(a+x) \approx L(a) + f(x)$$

Si $L$ es representado como un vector $G$ tal que $L(a) = G \cdot a$, a continuación, a lo largo de la línea de $L(a) \leq |G||a|$ $L(a) = \lambda |G|^2$ si $a=\lambda G$.

En resumen, la derivada es máxima a lo largo de la línea paralela a la dirección apuntada por $G$, el vector gradiente, que es nuestro elegido representiative de la función lineal que es el derivado de la $f$$x$.

2voto

Loai Najati Puntos 360

Es todo una cuestión de definición. Por la razón que sea, las primeras personas a formalizar todo esto se decidió que la dirección de la ascensión es la cosa que necesitaba un nombre y la dirección de descenso no. Todo funciona de cualquier manera, sin embargo. Si el término "gradiente" había sido golpeado en la dirección de descenso, sólo tendríamos que poner signos menos en frente de muchos aceptado resultados; eso es todo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X