34 votos

¿Qué se señala con ello?

En primer lugar, esta pregunta difiere de los demás en este sitio, me gustaría saber el significado aislado de nabla si que tiene sentido. Mientras tanto, otras preguntas se puede preguntar qué significa en relación a otra cosa. Esta podría ser una pregunta estúpida; es difícil decir cuando me esfuerzo para entender lo que se le indica, y por lo tanto esto puede parecer muy idiota para una persona plenamente informados acerca de su significado.

Ahora, en el documento Cómo hacer la $\nabla x$ $\nabla \cdot$ notaciones de trabajo?:

Enter image description here

Actualmente me interpretar la nabla símbolo como una forma de convertir algo en un vector. Es mi entendimiento correcto?

De todos modos, ¿cuál es el significado de la misma, y por qué se utiliza? (Por favor, tratar de describir es tan simple como sea posible.)

Menos importante

En caso de que no debe existir múltiples significados de este símbolo, este es el contexto: Me topé con este símbolo cuando la investigación de redes neuronales (C denota la función de costo):

"-∇C(...)= [*this is a vector of weights and biases*]" (fuente)

40voto

Podemos pensar de $ \nabla $ como un operador ( del operador ) en el siguiente sentido.

Se necesita una función de $f$ y se convierte en un vector de $\nabla f$ .

$\nabla f= \left\langle \frac {\partial f}{\partial x},\frac {\partial f}{\partial y}, \frac {\partial f}{\partial z} \right\rangle $ es llamado el vector gradiente.

El vector gradiente apunta a la dirección en la que su función se incrementa más rápidamente.

Por ejemplo, si $$ f(x,y,z)= x+3y^2 -10z$$ Then $$ \nabla f (x,y,z)= \langle 1,6y,-10\rangle $$

y si hay un punto dado, decir $(1,3,5)$, podemos evaluar la $ \nabla f (1,3,5)= \langle 1,18,-10\rangle.$

Este vector apunta en la dirección de máximo incremento de nuestra función en $(1,3,5).$

28voto

James Pearce Puntos 1934

Nabla es un vector cuyas componentes son los operadores. En el caso tridimensional que usted cita, $\nabla=(\partial_x,\partial_y,\partial_z)$. No es un vector en el sentido habitual (de vectores en $\mathbb R^3$), pero es que es muy conveniente abuso de notación.

El ejemplo dado en la pregunta ofrece una manera conveniente de escribir el gradiente de una función de $f:\mathbb R^3\to\mathbb R$ $$ \nabla f(x,y,z) = (\partial_xf(x,y,z),\partial_yf(x,y,z),\partial_zf(x,y,z)). $$ Resulta que este tipo de derivados es útil.

Si usted tiene una función de $g:\mathbb R^3\to\mathbb R^3$, hay dos típicos derivados que usted necesita. Uno de ellos es la divergencia, que es la magnitud escalar $\partial_xg_x(x,y,z)+\partial_yg(x,y,z)+\partial_zg(x,y,z))$. Es conveniente escribir esto como $$ \nabla\cdot g(x,y,z), $$ puesto que la fórmula en efecto, parece un producto interior de los vectores $g=(g_x,g_y,g_z)$, y el $\nabla$.

El otro es el rizo, que se da en términos de componentes como $$ (\partial_yg_z-\partial_zg_y,\partial_zg_x-\partial_xg_z,\partial_xg_y-\partial_yg_x). $$ (Omito los argumentos por razones de brevedad.) Este se parece a una cruz de producto, y de hecho, es típico de escribir como $\nabla\times g(x,y,z)$.

El punto es que existen estas tres instancias básicas donde es conveniente pensar en la $\nabla$ como un vector de operadores, incluso si tales objetos no son estudiados en general.

6voto

Andrew Li Puntos 574

Cómo lo has descrito, se utiliza como el gradiente de una función de cálculo multivariable.

Por sí mismo, el grupo de gestión puede ser considerado como un vector de derivadas parciales de los operadores, y cuando se aplica a una función multivariable, representa el vector de derivadas parciales de cada componente (producto escalar) y la dirección de subida más empinada para algunos datos de entrada:

$$\nabla = \begin{bmatrix}\frac{\partial}{\partial x} \\ \frac{\partial}{\partial y} \\ \frac{\partial}{\partial z} \\ \vdots\end{bmatrix}$$

$$\nabla f(x, y, z,\dots) = \begin{bmatrix}\frac{\partial}{\partial x}\,f(x, y, z,\dots) \\ \frac{\partial}{\partial y}\,f(x, y, z,\dots) \\ \frac{\partial}{\partial z}\,f(x, y, z,\dots) \\ \vdots\end{bmatrix}$$

El grupo de gestión pueden ser aplicados a un número de diferentes áreas en multivariable de cálculo, tales como la divergencia o curl. En todos estos casos, el grupo de gestión puede ser tratado como un vector que puede dot o cruz con otro vector, como una función multivariable. Dicho esto, es un operador.

6voto

leftaroundabout Puntos 1343

Conceptualmente, $\nabla$ es un operador que tiene un campo escalar (es decir, una suave, con un valor real de la función definida en un poco de espacio real – el espacio es generalmente de $\mathbb{R}^2$ o $\mathbb{R}^3$, pero también podría ser un mayor espacio tridimensional o una curva de colector $M$) y la que te da un cotangente-campo de vectores. $$ \nabla : (M\to\mathbb{R}) \(M\T^\ast(M)) $$ ¿Qué significa eso? Así, en lugar de definir estos términos directamente, permítanme darles la motivación por la forma en que se relacionan con el grupo de gestión. La idea detrás de un gradiente (o cualquier derivado, la verdad), es que se quiere localmente simplificar – linearise – una función/campo. Vamos a considerar la 1D primer caso, es decir,$M=\mathbb{R}$. Su función en sí puede tener algunos whacky ondulado curso que hace que sea difícil hacer mucho con ella, pero localmente (es decir, cuando el zoom en cualquier lugar), se puede aproximar muy bien por una simple línea recta.

Demo of how the derivative make a tangent that approximates any differentiable function.

Esta aproximación es una expansión de Taylor truncada. Su pendiente es la derivada de la función. Así, tenemos que el operador $$\begin{align} \operatorname{approx}_{x_0} &: (\mathbb{R}\to\mathbb{R}) \to (\mathbb{R}\to\mathbb{R}) \\ \operatorname{approx}_{x_0} & f\:(x) = f(x_0) + f'(x_0)\cdot (x-x_0) \end{align}$$

La idea de nabla es generalizar esto a los de mayores dimensiones de los dominios.

$$\begin{align} \operatorname{approx}_{x_0} &: (M\to\mathbb{R}) \to (M\to\mathbb{R}) \\ \operatorname{approx}_{x_0} & f\:(x) = f(x_0) + \operatorname{N\!A\!B}(x-x_0) \end{align}$$ Allí, necesitamos una cierta cantidad de la que puede sacar una diferencia local vector ( vector tangente en el espacio de la tangente $T_{x_0}(M)$) y escupir algo similar... lo que sea que $f$ cuando su argumento es perturbado por las que el vector. Que cantidad es $\operatorname{N\!A\!B}=\nabla f|_{x_0}$.

Generalmente hablando, se trata de volver a ser una función $$ \operatorname{N\!Un\!B} : T_{x_0}(M) \to \mathbb{R} $$ ...pero porque queremos que la aproximación a linearise $f$, debe ser específicamente un funcional lineal, es decir, un elemento del espacio dual $T_{x_0}^{\ast}(M)$ de la cotangente vectores.

Esto puede sonar complicado, pero en realidad resulta que el espacio dual de cualquier sensato espacio vectorial, sin duda de $\mathbb{R}^n$, es básicamente $\mathbb{R}^n$ nuevo. Es decir, el vector dual $\operatorname{NAB}$ puede ser equivalentemente reemplazado con un producto escalar con un vector, y para nabla, que el vector contiene las derivadas direccionales como entradas. Y eso es lo que vemos generalmente el operador nabla: $$ \nabla : (\mathbb{R}^n\to\mathbb{R}) \(\mathbb{R}^n\to \mathbb{R}^n) $$ que luego nos permite escribir la expansión de Taylor como $$\begin{align} \operatorname{approx}_{x_0} &: (\mathbb{R}^n\to\mathbb{R}) \to (\mathbb{R}^n\to\mathbb{R}) \\ \operatorname{approx}_{x_0} & f\:(x) = f(x_0) + \nabla f|_{x_0}\cdot (x-x_0) \end{align}$$

3voto

Jepsilon Puntos 9

Se corta la mano por el operador (teniendo el 3D caso):

$\nabla:=\textbf{i}\frac{\partial}{\partial x} + \textbf{j}\frac{\partial}{\partial y} + \textbf{k}\frac{\partial}{\partial z}$

Donde $\bf{i}$, $\bf{j}$, y $\bf{k}$ son los vectores unitarios a lo largo del eje. Ahora, el punto y la cruz operaciones también se corto la mano y son etiquetados como tales debido a que actúan sobre vectores en una manera similar que los respectivos productos.

Para las redes neuronales, la función de costo $C$ es lo que se conoce como un "campo escalar". En términos simples, es una función que toma en muchas entradas (o vectores) y escupe sólo un número real. Algunos otros relacionados, en el mundo real ejemplos de esto son, por ejemplo, la temperatura de una habitación $T(x,y,z)$ y la elevación de la tierra en una región montañosa $h(x,y)$, los cuales varían dependiendo de la posición (un vector) y te dan un número fijo (temperatura o de elevación).

Ahora, para realizar la gradiente de la pendiente, aquí están algunas cosas a tener en cuenta:

Dado escalar $C(\textbf{x})$, $\nabla C = \sum_\textbf{i}{\frac{\partial C}{\partial x_\textbf{i}}\textbf{i}}$ es un vector. Este vector apunta SIEMPRE "cuesta arriba", así que, naturalmente, $-\nabla C$ siempre apunta "hacia abajo".

Así que ahora tenemos que responder a la pregunta, "En el fin de avanzar en descenso desde mi ubicación actual, en qué dirección debo ir a?" Ahora sabemos que desde el anterior hecho de que el descenso de la dirección es $-\nabla C(\textbf{x}_n)$ desde nuestra ubicación actual $\textbf{x}_n$ por lo tanto podemos decir que si damos un paso y llegar a la posición $\textbf{x}_{n+1}$, se les garantiza a descender si seguimos la regla de $\textbf{x}_{n+1}=\textbf{x}_{n} - \nabla C(\textbf{x}_{n})$. Que es la fórmula recursiva para la gradiente de la pendiente de que probablemente has visto ya, pero el gradiente de plazo fue extendido por un valor muy pequeño que se refiere como la "tasa de aprendizaje". Lo que esto hace es hacer que el proceso tome pequeños pasos en la dirección dada en el fin de minimizar las posibilidades de que se pasa por la mínima convergencia mejor y no oscilan alrededor de los mínimos.

Ahora, tenga en cuenta que cuando se trabaja con este tipo de algoritmos, es muy común ver a la aplicación de técnicas heurísticas para reducir la potencia de procesamiento requisito. Por ejemplo:

Un común de la función de costo es $C=(y(x)-y_o)^2$ cuya derivada es $C'=2(y(x)-y_o)y'(x)$. Desde este conseguirá finalmente reducido por el ritmo de aprendizaje de todos modos, el factor de 2 (o cualquier otro escalar constante) es generalmente omitido, ya que no contienen ningún tipo de información acerca de la dirección de descenso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X