12 votos

Motivo de la definición de producto interior

Los matemáticos se enorgullecen de escribir pruebas de proposiciones de forma elegante, pero con frecuencia (¿quizá incluso normalmente?) descuidan escribir formalmente las motivaciones de las definiciones con la misma elegancia, eficiencia y, a veces, belleza, y descuidan asignar ejercicios en los que se reta al estudiante a demostrar que una definición es la única (a veces hasta algunas formulaciones lógicamente equivalentes) que satisface algunos desiderata. A menudo, un libro de texto se limitará a decir dogmáticamente "Un subhipopótamo conjugado a la izquierda y a la derecha es una cosa que bla bla bla ". ${}\,\ldots$ " Como ya he comentado en otro lugar de este foro, normalmente se considera lícito definir el concepto de "grupo" diciendo que un grupo es un conjunto con una operación binaria que satisface etc. etc. etc. y luego pasar a demostrar tropecientos teoremas de teoría de grupos, en lugar de mostrar desde el principio cómo se desarrolló el concepto a partir de una variedad de ejemplos concretos que implican transformaciones en geometría, biyecciones, matrices, etc.

Definición: El producto interior $\langle u,v\rangle$ de dos vectores $u=(u_1,\ldots,u_n), v=(v_1,\ldots,v_n) \in\mathbb C^n$ es $$ \sum_{k=1}^n u_k \overline{{}\,v\,{}}_k $$ donde $\overline{a}$ es el conjugado complejo de $a\in\mathbb C$ .

Un amigo me preguntó una vez por qué se toman conjugados. Y quizá por qué sólo de las componentes del segundo vector y no del primero.

Mi respuesta fue que hace $\|u\|^2$ en todos los casos positivo (excepto cuando $u=0$ ) y hace que el teorema de Pitágoras funcione sin problemas, de modo que se puede aplicar algo de geometría euclidiana básica en estos espacios. Su reacción incluyó cierta indignación por no habérselo dicho los libros de texto y los profesores. Tal vez esto tenga la misma relación con una buena respuesta digna de publicación que un vago argumento de manipulación con una prueba adecuada.

Así pues, supongamos que nuestras costumbres respecto a la redacción de las motivaciones de las definiciones fueran como las de nuestras costumbres respecto a la redacción de las pruebas. Queremos que sean completas, correctas, informativas, que satisfagan exigencias razonables de justificación, elegantes, bellas, comprensibles para el público al que van dirigidas y tan sencillas como sea posible dentro de las limitaciones anteriores. Las motivaciones especialmente inteligentes se publicarían en cosas como el Mensualmente de la misma manera que ahora se publican pruebas nuevas o inusualmente bonitas de teoremas antiguos. Una motivación especialmente brillante para una nueva definición podría ser el conjunto del tema de un artículo en una revista de investigación, quizá en raros casos ganar una medalla Fields.

Así que.., ¿cómo redactar una buena motivación digna de publicación para la definición anterior de acuerdo con las normas expuestas en el párrafo anterior?

8voto

aes Puntos 5160

Métricas hermitianas y métricas de valor real

La noción de Métrica hermitiana surge naturalmente si se considera un espacio vectorial complejo como su espacio vectorial real subyacente con una estructura adicional, y se pregunta cuál debería ser la noción de una métrica que "juegue bien" con esa estructura adicional.

Espacios vectoriales complejos

Considere $V$ un espacio vectorial complejo, es decir, tiene una multiplicación escalar $\mathbb{C} \times V \rightarrow V$ y satisface las propiedades del espacio vectorial. Entonces $V$ es también un espacio vectorial real (de doble dimensión, si es de dimensión finita) utilizando la restricción de la multiplicación escalar $\mathbb{R} \times V \rightarrow V$ .

La estructura adicional que $V$ tiene como espacio vectorial complejo es simplemente la multiplicación por $i$ . Es decir, considerando $V$ como un espacio vectorial real, tenemos un mapa $J : V \rightarrow V$ dada por la multiplicación escalar por $i$ . Este mapa es lineal y tiene $J^2 = -I$ . (A partir de aquí podemos recuperar la estructura de un espacio vectorial complejo para $V$ ya que ahora sabemos cómo multiplicar escalarmente por $a+bi$ utilizando el mapa lineal $aI + bJ$ .)

Introducción de una métrica de valor real

Introduzcamos ahora una métrica de valor real sobre $V$ que es una forma bilineal simétrica, positiva-definida $g: V \times V \rightarrow \mathbb{R}$ que es $\mathbb{R}$ -lineal.

¿Cómo $g$ interactuar con la estructura adicional de la multiplicación por $i$ que hemos denominado $J : V \rightarrow V$ ?

La opción natural es exigir $J$ sea una isometría con respecto a $g$ . Es decir, $g(Jv,Jw) = g(v,w)$ . ¿Por qué es ésta la elección natural?

  1. Multiplicación por $i$ en el plano complejo con la métrica habitual es la rotación en sentido contrario a las agujas del reloj por $90^\circ$ una isometría.

  2. Si consideramos $\mathbb{C}^n$ como $\mathbb{R}^{2n}$ y poner la métrica estándar en $\mathbb{R}^{2n}$ entonces la multiplicación por $i$ es una isometría: es la rotación por $90^\circ$ en cada uno de los ejes de coordenadas complejas.

  3. Con $J^2 = -I$ que es una isometría que requiere $J$ sea también una isometría es una opción bastante natural para cómo $J$ y $g$ deben interactuar.

  4. Al final resulta bastante bien algebraicamente.

Consecuencias

Ahora tenemos $V$ un espacio vectorial real con la estructura adicional de multiplicación por $i$ denota $J: V \rightarrow V$ y con una métrica $g$ , satisfaciendo $g(Jv,Jw) = g(v,w)$ .

Reclamación: $g(v,Jv) = 0$ .

Prueba: $g(v,Jv) = g(Jv,J^2v) = g(Jv,-v) = g(-v,Jv) = -g(v,Jv)$ por lo que debe ser cero.

Una forma simpléctica gratuita

Definir una forma bilineal $\omega: V \times V \rightarrow \mathbb{R}$ vía $\omega(v,w) = g(v,Jw)$ .

Entonces $\omega(v,v) = 0$ Así que $\omega$ es alterna. También es no-degenerada, porque $g$ es y $J$ es invertible. Por lo tanto es un forma simpléctica (una forma bilineal alternante no degenerada sobre $V$ ).

La forma hermitiana

Una forma hermitiana es un objeto distinto de $g$ o $\omega$ es una forma real-bilineal valorada en $\mathbb{C}$ es decir, un mapa bilineal $V \times V \rightarrow \mathbb{C}$ que además no es degenerada, satisface $h(\lambda v,w) = \lambda h(v,w)$ y $h(v,\lambda w) = \overline{\lambda} h(v,w)$ y satisface $h(v,w) = \overline{h(w,v)}$ .

Sea $h = g + i \omega$ . Obsérvese que lo hemos construido enteramente con $g$ con $h(v,w) = g(v,w) + i g(v,Jw)$ . Afirmo que se trata de una métrica hermitiana.

Comprobación de la multiplicación escalar en el primer factor :

$h(av,w) = g(av,w) + i g(av,Jw) = a(g(v,w) + i g(v,Jw)) = a\, h(v,w)$ .

Y $h((bi)v,w) = g(bJv,w) + i g(bJv,Jw) = g(-bv,Jw) + i g(bv,w) = (bi)(g(v,w) + i g(v,w)) = (bi) h(v,w)$ .

Así que $h(\lambda v,w) = \lambda h(v,w)$ para $\lambda \in \mathbb{C}$ .

Comprobación de la multiplicación escalar en el segundo factor :

$h(v,aw) = g(v,aw) + i g(v,aJw) = a(g(v,w) + i g(v,Jw)) = a\, h(v,w)$ .

Y $h(v,(bi)w) = g(v,bJw) + i g(v,bJ^2w) = b( g(v,Jw) - i g(v,w)) = (-bi)(g(v,w) + i g(v,w)) = (-bi) h(v,w)$ .

Así que $h(v,\lambda w) = \overline{\lambda} h(v,w)$ para $\lambda \in \mathbb{C}$ .

También tiene :

$h(w,v) = g(w,v) + i \omega(w,v) = g(v,w) - i \omega(v,w) = \overline{h(v,w)}$ .

Por lo tanto :

$h$ es una forma hermitiana. De hecho, toda forma hermitiana surge de este modo:

Volver atrás

Partiendo de una forma hermitiana $h$ , dejemos que $g = \mathfrak{Re}(h)$ y $\omega = \mathfrak{Im}(h)$ . A continuación, puede comprobar que $g$ es una métrica real y $\omega$ es una forma simpléctica e igual a $g(v,Jw)$ .

En coordenadas

Considere $\mathbb{C}^n$ con un espacio vectorial real subyacente $\mathbb{R}^{2n}$ con la métrica estándar de valor real en $\mathbb{R}^{2n}$ . Como ya se ha señalado, la multiplicación por $i$ es una isometría para esta métrica.

Escriba a $\mathbb{R}^{2n} = \mathbb{R}^n \oplus \mathbb{R}^n$ con multiplicación por $i$ un isomorfismo del primer factor al segundo. Escribe $(v_j)_{j=1}^n$ para la base estándar del primer factor y $(Jv_j)_{j=1}^n$ para la base normalizada correspondiente al segundo factor.

Entonces (utilizando la notación sumatoria de Einstein):

$h(a_jv_j + b_jJv_j, c_k v_k + d_k J v_k)$ es igual a

$g(a_jv_j + b_jJv_j, c_k v_k + d_k J v_k) + i g(a_jv_j + b_jJv_j, c_k Jv_k - d_k v_k)$

que es igual a

$a_j c_j + b_j d_j + i(- a_j d_j + b_j c_j)$

que es igual a

$(a_j + i b_j)(c_j - i d_j)$

Esta es la forma Hermitiana estándar $\left<z,w\right> = z_j \overline{w}_j$

Una convención alternativa

Una convención alternativa es definir $\omega(v,w) = g(Jv,w)$ . Esto conduce a una variante en la que $g+i\omega$ es conjugado-lineal en el primer factor y lineal en el segundo. Es decir, la forma estándar que obtendrías en $\mathbb{C}^n$ sería $\left<z,w\right> = \overline{z}_j w_j$ .


No afirmo que lo anterior sea "¿Qué es un $\ldots$ ¿Métrica hermitiana?" calidad.

La métrica hermitiana es uno de los aspectos que se pasan por alto en los planes de estudios universitarios. En mi experiencia, no se suele aprender lo anterior hasta que se estudian las variedades complejas o la geometría algebraica compleja.

3voto

Schneems Puntos 3208

Denotemos el producto interno real canónico por $\langle v,w\rangle_{\mathbb{R}}$ donde $v,w\in\mathbb{R}^n$ .

Si queremos definir un producto interior complejo en $\mathbb{C}^n$ , $\langle v,w\rangle_{\mathbb{C}}$ ya que $\mathbb{C}^n\supset\mathbb{R}^n$ podemos pensar que este producto interior complejo es una extensión del producto interior real. Así, si $v,w\in\mathbb{R}^n$ entonces $\langle v,w\rangle_{\mathbb{C}}=\langle v,w\rangle_{\mathbb{R}}$ .

Ahora, también deberíamos pedir que $\langle v,v\rangle_{\mathbb{C}}\geq 0$ porque queremos definir la norma de $v$ como $\|v\|=\sqrt{\langle v,v\rangle_{\mathbb{C}}}$ .

Por lo tanto, queremos dos propiedades para $\langle v,w\rangle_{\mathbb{C}}$ :

  1. $\langle v,w\rangle_{\mathbb{C}}=\langle v,w\rangle_{\mathbb{R}}$ si $v,w\in\mathbb{R}^n$ .
  2. $\langle v,v\rangle_{\mathbb{C}}\geq 0$ porque queremos definir $\|v\|$ tal que $\|v\|^2=\langle v,v\rangle_{\mathbb{C}}$ .

Consideremos ahora $n=1$ .

Si $a,b\in\mathbb{R}^1$ entonces $\langle a,b\rangle_{\mathbb{C}}=\langle a,b\rangle_{\mathbb{R}}=ab$

Si $a\in\mathbb{C}^1$ entonces $\langle a,a\rangle_{\mathbb{C}}$ debe ser el cuadrado de una norma. Pero $\mathbb{C}^1$ tiene una norma canónica, ya que estamos tratando de ampliar nuestras definiciones, vamos a utilizar esta norma canónica. Así $\langle a,a\rangle_{\mathbb{C}}=|a|^2=a\overline{a}$ .

Así, obtuvimos estas dos propiedades:

  1. $\langle a,b\rangle_{\mathbb{C}}=ab$ si $a,b\in\mathbb{R}$ .
  2. $\langle a,a\rangle_{\mathbb{C}}=a\overline{a}$ .

Entonces, ¿cómo debe definirse $\langle a,b\rangle_{\mathbb{C}}$ para $a,b\in\mathbb{C}^1$ ? Respuesta: $\langle a,b\rangle_{\mathbb{C}}=a\overline{b}$ .

Por analogía en $\mathbb{C}^n$ el producto interior debe ser $\langle(a_1,\ldots,a_n),(b_1,\ldots,b_n)\rangle=\sum_{i=1}^na_i\overline{b_i}$ (Aquí también podríamos decir que si $(V,\langle\cdot,\cdot\rangle_1)$ y $(W,\langle\cdot,\cdot\rangle_2)$ son espacios de producto interno, entonces $V\times W$ es un espacio de producto interno con este producto interno $\langle(v_1,w_1),(v_2,w_2)\rangle=\langle v_1,v_2\rangle_1+\langle w_1,w_2\rangle_2$ ).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X