6 votos

¿Qué es la motivación/aplicación de espacios duales y transpone?

Siempre me ha desconcertado a dónde se transpone vienen. He encontrado esta pregunta, pero la respuesta no es satisfactoria para mí - la idea parece ser "dual espacios son importantes, y se pueden definir transpone con aquellos". Esto deja dos preguntas:

  1. ¿Por qué en dos espacios importantes?
  2. Lo que queremos hacer con dos espacios, cómo se hace la transposición de ayudarnos a lograr eso?

Para el punto (1) mi álgebra lineal profesor me dijo algo que yo no encuentro bastante satisfactorio, y es que si usted está interesado en transformaciones lineales, luego doble los espacios son el "tipo más simple" de la transformación lineal. Esto es bastante vago, aunque... ¿qué problemas podría queremos resolver en el que el concepto de la doble espacio iba a surgir de forma natural? Y cómo sería el concepto de transposición surgir naturalmente de aquellos?

1voto

Keltia Puntos 8104

Doble los espacios son importantes porque ellos se presentan por todo el lugar. El mapa que se asigna el valor de $p(1)$ a el polinomio $p(t)$ es un elemento del espacio dual del espacio de polinomios. La traza el mapa de la $n\times n$ matrices es un elemento del espacio dual del espacio de matrices. El mapa enviar a un vector de longitud $n$ a la suma de las entradas es un elemento del espacio dual de $\mathbb{R}^n$.

Así que estamos utilizando dos espacios todo el tiempo, y puede ser útil para reconocer el hecho.

El tranpose surge porque cada lineal mapa de $L$ $U$ $V$determina lineal en el mapa desde el espacio dual $W^*$ a la del espacio dual $V^*$. En dimensiones finitas podemos identificar un espacio vectorial y su doble, y si lo hacemos bien, el dual de un lineal mapa es la transpuesta.

1voto

Jan D. Puntos 316

Una manera de motivar dual espacios y transpone es considerar la diferenciación de funciones escalares de varias variables. El punto básico es que los funcionales son los más fáciles de funciones para lidiar con el corto de la constante de funciones, por lo que la diferenciación es esencialmente la aproximación por una única funcional tal que el error en la aproximación es suficientemente portado bien. Por otra parte, transpone surgen de forma natural a la hora de diferenciar, es decir, la composición de una función con valores escalares con un cambio de coordenadas.

Deje $f : (a,b) \to \mathbb{R}$. Convencionalmente, se define el $f$ a ser diferenciable en a $x \in (a,b)$ si el límite $$ \lim_{h \to 0} \frac{f(x+h)-f(x)}{h} $$ existe, en cuyo caso el valor de dicho límite se define como la derivada $f^\prime(x)$$f$$x$. Observe, sin embargo, que esta definición significa que para $h$ lo suficientemente pequeño, $$ f(x+h)-f(x) = f^\prime(x)h + R_x(h), $$ donde $h \to f^\prime(x)h$ define una transformación lineal $df_x :\mathbb{R} \to \mathbb{R}$ aproximar $f$ cerca de $x$, y donde el término de error $R_x(h)$ satisface $$ \lim_{h \to 0} \frac{R_x(h)}{h} = 0. $$ De hecho, $f$ es diferenciable en a $x$ si y sólo si existe una transformación lineal $T : \mathbb{R} \to \mathbb{R}$ tal que $$ \lim_{h \to 0} \frac{\lvert f(x+h) - f(x) - T(h) \rvert}{\lvert h \rvert} = 0, $$ en el que caso de $df_x := T$ es único, y dada por la multiplicación por escalares $f^\prime(x) = T(1)$.

Ahora, vamos a $f : U \to \mathbb{R}^m$ donde $U$ es un subconjunto abierto de $\mathbb{R}^n$. Entonces, podemos definir perfectamente a $f$ a ser diferenciable en a $x \in U$ si y sólo si existe una transformación lineal $T : \mathbb{R}^n \to \mathbb{R}^m$ tal que $$ \lim_{h \to 0} \frac{\| f(x+h) - f(x) - T(h) \|}{\|h\|} = 0, $$ en el que caso de $df_x := T$ es único; en particular, para $\|h\|$ lo suficientemente pequeño, $$ f(x+h) - f(x) = df_x(h) + R_x(h), $$ donde $df_x$ da una aproximación lineal de $f$ cerca de $x$, de tal manera que el término de error $R_x(h)$ satisface $$ \lim_{h \to 0} \frac{R_x(h)}{\|h\|} = 0. $$

Por último, vamos a especializar a los casos en que $f : U \to \mathbb{R}$, es decir, donde $m=1$. Si $f$ es diferenciable en a$x$, $df_x : \mathbb{R}^n \to \mathbb{R}$ es lineal, y por lo tanto,$df_x \in (\mathbb{R}^n)^\ast$, por definición. En particular, para cualquier $v \in \mathbb{R}^n$, la derivada direccional $$ \nabla_v f(x) := \lim_{\epsilon \to 0} \frac{f(x+\epsilon v) - f(x)}{\epsilon} $$ existe y está dada por $$ \nabla_v f(x) = (d_x f)(v). $$ Por otra parte, el gradiente de la $f$ $x$ es exactamente el único vector de $\nabla f(x) \in \mathbb{R}^n$ tal que $$ \forall v \in \mathbb{R}^n, \quad (d_x f)(v) = \langle \nabla f(x), v \rangle. $$ En cualquier caso, la derivada de una función con valores escalares de $n$ variables en un punto es más natural entendido como una funcional en $\mathbb{R}^n$, es decir, como un elemento de $(\mathbb{R}^n)^\ast$.

Ahora, supongamos, por simplicidad, que el $f : \mathbb{R}^n \to \mathbb{R}$ está en todas partes-diferenciable, y deje $S : \mathbb{R}^p \to \mathbb{R}^n$ ser una transformación lineal, por ejemplo, un cambio de coordenadas $\mathbb{R}^n \to \mathbb{R}^n$. A continuación, $f \circ S$ es de hecho en todas partes derivable con derivada $$d_y(f \circ S) = (d_{Sy} f) \circ S = S^t d_{Sy} f,$$ at $y \in \mathbb{R}^p$. On the one hand, if $S = 0$, then $f \circ S = f(0)$ is constant, so that $d_y(f \circ S) = 0 = S^t d_{Sy} f$, as required. On the other hand, if $S \neq 0$, por lo que $$ \|S\| := \sup_{k \neq 0} \frac{\|Sk\|}{\|k\|} > 0, $$ de ello se sigue que $$ \frac {\|f \circ S)(y+k)-(d_{Sy} f \circ S)(k)\|}{\|k\|} = \frac{\|f(Sy + Sk) - d_{Sy}f(Sk)\|}{\|k\|} \leq \|S\|\frac{\|f(Sy + Sk) - d_{Sy}f(Sk)\|}{\|Sk\|} \0, \quad k \a 0 $$ por la diferenciabilidad de $f$ $Sy$ y la continuidad del mapa $$ k \mapsto \|S\|\frac{\|f(Sy + Sk) - d_{Sy}f(Sk)\|}{\|Sk\|}. $$ Más concretamente, una vez que sabes que $f \circ S$ es diferenciable en todas partes, entonces para cada a $v \in \mathbb{R}^n$, por la linealidad de la $S$, $$ (f \circ S)(y + \epsilon v) = f(Sy + \epsilon Sk), $$ así que, de hecho, $$ \left(d_y(f \circ S)\right)(k) = \nabla_k(f \circ S)(y) = \nabla_{Sk}f(Sy) = (d_{Sy}f)(Sk) = (S^t d_{Sy}f)(k). $$ En general, si $S : \mathbb{R}^p \to \mathbb{R}^n$ está en todas partes diferenciable (de nuevo, por simplicidad), entonces $$ d_y (f \circ S) = (d_{Sy}f) \circ d_y S = (d_y S)^t d_{Sy}f, $$ que no es otro que el correspondiente caso de la regla de la cadena.

1voto

Peter Smith Puntos 513

¿Entiende usted el concepto de un centro de producto? Es la abstracción de la noción de la norma dot-producto que se utiliza en el cálculo vectorial. Si usted está trabajando en un espacio de Hilbert $\mathscr{H}$, es decir, un espacio vectorial que viene equipado con un interior-producto$\langle \cdot, \cdot \rangle$, la cual se completa (integridad es una condición topológica de modo que todas las secuencias de Cauchy converge) -- a continuación, hay un famoso por el teorema de Riesz que indica que hay una dualidad natural entre el $\mathscr{H}$ e su (continua) el espacio dual $\mathscr{H}^*$ a través del interior del producto $\langle \cdot, \cdot \rangle$; esta dualidad está dado por $y \in \mathscr{H}$ es dual a $l_y \in \mathscr{H}^*$ donde $l_y(x) = \langle y, x\rangle$. Para un vector $y \in \Bbb{R}^n$, el operador $l_y$ es sólo la transpuesta de a $y$ (cuando consideramos el interior del producto en $\Bbb{R}^n$ a ser el estándar dot-producto).

Tal vez la abstracción de lo que he escrito arriba es convoluting cómo es físicamente un importante constructo. Por su parte, en la mecánica cuántica, si alguna vez uso de Dirac "bra-c-ket" notación, a menudo, escribir $\langle \varphi |$ $|\varphi \rangle$ como vectores donde $|\varphi\rangle$ es un cuadrado integrable función de onda que representan algunas de las físicas de densidad de probabilidad (función de crear un espacio de Hilbert con un interior natural-producto $\langle \cdot, \cdot \rangle$) y $\langle \varphi |$ es el vector dual de $|\varphi \rangle$ a través de la Riesz dualidad descrita anteriormente (es decir, $\langle \varphi |$ es como una versión abstracta de la transpuesta de a $|\varphi\rangle$). En particular, la mayoría de los observables pueden ser representados por los operadores de $H$ en este espacio de Hilbert, y calcular físicos significativos valores a través de expresiones tales como $\langle \psi | H | \varphi \rangle$, lo que es sugestivo de la misma como $\langle \psi, H \varphi \rangle$ en el interior-producto de la notación; tales expresiones (tal vez sutilmente) son el uso de dos espacios y abstracto transpone.

Otro ejemplo podría venir de la geometría, en donde si buscamos en mecánica en algunas curvas en el espacio (una de Riemann del colector), en cada punto de $x$ no es un espacio vectorial $V$ que representa a todos los vectores de velocidad de las posibles trayectorias de las partículas que viajan a través del punto de $x$ sobre el espacio curvo. En esta configuración (de un colector de Riemann), hay un interior-producto en $V$, lo que de nuevo nos da la dualidad entre el $V$ y su dual $V^*$ (de nuevo, por la noción abstracta de transposición). Como se ha mencionado, $V$ representa los vectores de velocidad de la partícula que se mueve a través del punto de $x$, pero la doble $V^*$ representa el impulso de la partícula, y, ciertamente, el impulso es una cantidad significativa.

1voto

Muphrid Puntos 12245

Digamos que usted tiene un espacio vectorial con producto interior, es decir, para dos vectores $a, b$ no es un escalar $a \cdot b$.

Deje $w$ ser algunos de vectores; entonces podemos definir una lineal mapa de $\omega(a) = a \cdot w$ cualquier $a$. El mapa de $\omega$ es un elemento del espacio dual.

Una aplicación de este tipo de mapas es una proyección sobre una de coordenadas de la base. Para escribir un vector $a$ como una combinación lineal de los vectores de la base $e_1, e_2, \ldots$, uno calcula los vectores $e^1, e^2, \ldots$ tal que $e^1$ es ortogonal a $e_2, e_3, \ldots$ y así sucesivamente. A continuación, el mapa de $a \mapsto a \cdot e^1$ nos da la correcta coeficiente: $a = (a \cdot e^1) e_1 + (a \cdot e^2) e_2 \ldots$. De nuevo, ese mapa es un elemento del espacio dual.

Ahora, dado nuestro mapa de $\omega$ anterior, ¿qué sucede si nos alimentamos en $T(a)$ donde $T$ es de algún operador lineal que los mapas de vectores los vectores?

Nos quedaría algo como

$$(\omega \circ T)(a) = w \cdot T(a)$$

Hay otro elemento $\chi$ de la doble espacio, recuerda que es un mapa-que tiene la forma más simple

$$\chi(a) = x \cdot a = w \cdot T(a)$$

para algunos vectores $x$? Sí, lo hay: una definición común de la transpuesta en un espacio métrico es simplemente que $w \cdot T(a) = T^\dagger(w) \cdot a$. A continuación, nos gustaría obtener

$$\chi(a) = T^\dagger(w) \cdot a$$

Y se podría decir que el $\chi$ es sólo el resultado de algunos lineal transformtion en $\omega$. Es decir, que $T^*$ denotar algunas análogas operador lineal sobre el espacio dual, y obtenemos

$$\chi = T^*(\omega)$$

He utilizado dos diferentes notaciones para transponer aquí - $T^*$ para la transposición cuyo dominio es los elementos de la doble espacio, y $T^\dagger$ para la transposición cuyo dominio es los elementos de la base del espacio vectorial. Sólo sobre la base de lo que sus entradas son, usted debe estar convencido de que estas deben ser conceptos diferentes, pero que están muy estrechamente relacionados, y en un espacio métrico, sería fácil y común para trabajar sólo con el uno que es más conveniente. Es realmente algo redundante para mantener la distinción entre los vectores duales y ordinario de los vectores.

Que no es cierto cuando usted consigue más general, no métricas espacios, en la que los vectores duales ya no se corresponden canónicamente a cualquier particular, ordinario de vectores. Por lo tanto, usted no puede escribir los mapas que son elementos de doble espacio en términos de productos de puntos sin una métrica, pero los mapas en sí todavía puede existir.

0voto

rych Puntos 1138

El espacio dual contiene lineal funcionales utilizados para obtener numérico descripción de los vectores, lo que es más importante, el de una de las formas $\beta^i$ la lectura de las coordenadas de un vector en una base elegido $\{a_i\}$: $\beta^i(v)=v^i$.

El conjunto $\{\beta^i\}$ formulario de la base dual y cualquier funcional lineal $\omega$ puede ser expresada como una suma $\omega_i\beta^i$. Por lo tanto, $\omega(v)=\omega_iv^i=wv$, donde reutilizamos los símbolos también indicar sus coordenadas representaciones: fila-vector $\omega$ y la columna de vectores $v$, su matriz producto luego de ser sólo $\omega v$.

Ahora, vamos a $v=f(u)$ o en forma de matriz $v=Au$. Definimos el mapa de transponer $f^*$ como un "pull-back" de cualquier $\omega$ por medio de la composición del mapa, $f^*\omega=\omega\circ f$, o en notación matricial:

$$\omega v=\omega(Au)=(\omega A)u.$$

Donde es la esperada $A^T$? Una cita de wikipedia: "$f$ está representado por $A$ que actúa sobre la izquierda en la columna de vectores, $f^*$ es representado por la misma matriz que actúa sobre el derecho de vectores fila." Sin embargo, si hay un producto interior, el cual identifica el espacio de vectores columna con el doble de espacio de vectores fila, entonces podemos escribir (otra vez abusando del mismo símbolo $\omega$ ahora para denotar el doble-doble columna-vector),

$$\omega^T v=\omega^T(Au)=(\omega^T A)u=(A^T\omega)^Tu,$$ - un familiar de la definición de mapa de transponer a través del interior del producto. Espero que @Marc van Leeuwen aprueba que yo no empezar desde el interior del producto, pero terminó con ella.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X