En el curso introductorio de análisis complejo que estoy tomando, casi cada teorema se relaciona con rotación y argumento. ¿Por qué a los números complejos les gusta tanto hacer esto? Puedo entender por qué estos teoremas funcionan; sin embargo, aparte del conocimiento básico de coordenadas polares, no entiendo intuitivamente qué propiedad de los números complejos hace que la rotación y el ángulo sean una idea tan común/conveniente.
Respuestas
¿Demasiados anuncios?Otra forma de ver esto es pensar en la multiplicación compleja como una transformación lineal en $\mathbb{R}^2$.
Fijemos un número complejo $c = a + ib$, entonces para cualquier número complejo $z = x + iy$, el producto $cz$ es
$$ cz = (ax - by) + i(ay + bx). $$
Es fácil ver que $z\mapsto cz$ es una transformación lineal. ¿Qué pasaría si por un momento olvidamos la estructura compleja y pensamos en $z$ como un vector en $\mathbb{R}^2$? Tratemos la parte real como la primera coordenada y la parte imaginaria como la segunda coordenada como de costumbre. Entonces, el producto $cz$ está representado por el producto matriz vector
$$ \begin{pmatrix} a & -b \\ b & a\end{pmatrix} \begin{pmatrix} x \\ y\end{pmatrix}. $$
(¡Revísalo tú mismo si no estás seguro!) La matriz que representa a $c$ tiene una forma muy especial que puede parecer familiar. Si recordamos que $c$ también representa un número complejo y por lo tanto corresponde a un vector también, podemos escribir $a$ y $b$ de una manera especial con algo de trigonometría del triángulo rectángulo: $a = |c| \cos(\theta)$ y $b = |c| \sin(\theta)$. Haciendo estas sustituciones, obtenemos que $cz$ puede ser representado por
$$ |c|\begin{pmatrix} \cos(\theta) & -\sin(\theta) \\ \sin(\theta) & \cos(\theta) \end{pmatrix} \begin{pmatrix} x \\ y\end{pmatrix}. $$
Esta matriz es exactamente una matriz de rotación, por lo que multiplicar $z$ por $c$ rota $z$ por el ángulo que $c$ forma con el eje $x$ positivo. Por supuesto, esta respuesta es efectivamente equivalente a las otras, pero me gusta la ligera dosis de álgebra lineal para ayudar a hacer más conexiones con otras áreas de matemáticas y así solidificar más la comprensión.
En lugar de definir los números complejos algebraicamente, vamos a comenzar con las nociones geométricas con las que estamos familiarizados en los números reales y extenderlas al plano. Con este fin, necesitamos distinguir entre un número como una etiqueta para una posición y un número como una acción o un verbo. Llamemos al número de posición $z$ y al número de acción $\alpha$ para mantener las ideas separadas aunque ambos sean números reales.
Ahora, ¿cómo actúa la suma de $\alpha$ en $z$? Si observamos $z + \alpha$, podemos ver que es una translación. Mueve $x$ por $\vert \alpha \vert$ unidades en la dirección de $\alpha$. En dos dimensiones esto se abstrae bien con un vector $z$ para la posición y un vector $\alpha$ para el desplazamiento mediante una adición componente a componente.
Para la multiplicación, si consideramos $\alpha z$, vemos que estamos escalando $z$ por $\vert \alpha \vert$ y si $\alpha$ es negativo, invierte la línea. Podríamos interpretar esto como una reflexión o una rotación, pero las reflexiones nos requieren elegir una línea de reflexión específica, lo cual es algo artificial en dos dimensiones, así que iremos con rotaciones en su lugar.
Con este fin, queremos que la multiplicación en dos dimensiones tenga la propiedad de que $\alpha z$ escala $z$ por $\vert \alpha \vert$ y lo rota en la dirección de $\alpha$. Esto significa que si escribimos $z=(r,\theta)$ y $\alpha = (s, \phi)$ en forma polar, queremos que $\alpha z = (rs, \theta + \phi)$ donde el radio se escala y los ángulos se suman.
La rotación y el escalado se pueden caracterizar por cómo $\alpha$ actúa en el círculo unitario. Esto debería ser familiar de la trigonometría, ya que definimos las funciones seno y coseno en el círculo unitario para facilitar los argumentos de escalado. En nuestro esquema, si $z$ está en el círculo unitario, es de la forma $z=(1,\theta)$, de manera que $\alpha z = (s , \theta + \phi)$. Esto facilita recuperar el factor de escala $s$.
Ahora hay dos puntos en coordenadas cartesianas en el círculo unitario que destacan además de los habituales $\pm 1$ de la recta real que son $(0,1)$ y $(0,-1)$ y se llaman $\pm i$ por razones históricas. Esto nos permite escribir números en el plano complejo en la forma $z= x + yi$ para el real $x$ e $y$ para representar el punto $(x,y)$. Deben tener dos propiedades importantes que son que $\vert \pm i \vert =1$ y $(\pm i)^2=-1$.
Pero ahora hemos terminado. Hemos reconstruido la forma cartesiana de nuestros números de rotación sin tener que recurrir a la álgebra en absoluto. ¿Por qué funciona esto? Bueno, si consideramos la matriz de rotación estándar de un cuarto de vuelta de álgebra lineal, tiene la ecuación característica $x^2+1$, por lo que tiene autovalores $\pm i$. Por lo tanto, hay este sutil vínculo entre la idea geométrica y la algebraica que no es del todo evidente. A pesar de esto, las ideas geométricas preceden a los números complejos por al menos un milenio. La mayoría de las ideas geométricas realmente anteceden a la álgebra por completo. Así que de una manera muy natural, es el mejor punto de partida. Por esta razón prefiero llamarlos los números del círculo. La $\mathbb{C}$ simplemente está ahí y encaja mucho mejor.
"No entiendo intuitivamente cuál es la propiedad de los números complejos que hace que la rotación y el ángulo sean una idea tan común/conveniente"
Es debido a la forma en que está definida la multiplicación de números complejos, y más específicamente, es debido al efecto del número $i$.
Si consideras los números reales como un espacio vectorial de 1D, la multiplicación por un escalar se puede pensar de la siguiente manera: tomas un número de entrada (un vector de 1D), y lo multiplicas por un escalar dado - el resultado tendrá entonces la misma relación con el número de entrada original que el escalar elegido tiene con el número uno (1).
Por ejemplo, supongamos que estás multiplicando por $3$; si denoto el número "de entrada" subrayándolo, entonces $\underline{2} \cdot 3 = 6$ porque $6/2$ es lo mismo que $3/1$. En otras palabras, estás escalando la entrada por $3$.
En la imagen a continuación, imagina tomar las dos barras, y estirarlas uniformemente, manteniendo el extremo inicial en cero, para que el otro extremo de la barra negra termine arriba de $2$. La longitud de la barra roja es el resultado.
¿De acuerdo? ¡Ahora observa! (Para tomar prestada una frase de Neil deGrasse Tyson.)
Toma un número complejo, digamos $3 + i$. Tiene una cierta relación con el número uno ($1 + 0i$): está en cierto ángulo, y su módulo es mayor que uno por una cierta cantidad (por $\sqrt{10}$). Representemos eso en la imagen a continuación conectando simplemente su posición en el plano complejo con ($1 + 0i$), para que ahora tengamos el triángulo representado abajo. Esta es una representación gráfica de nuestro "factor de escala complejo".
Ahora, tomemos otro número complejo, por ejemplo $2 + i$. Este será nuestro número "de entrada", y lo vamos a escalar por el primero utilizando el mismo principio que describí en la introducción.
Ahora toma nuestro triángulo; mantén el inicio de las flechas en cero, pero rótalo y escálalo para que lo que originalmente era $1 + 0i$ se superponga precisamente a nuestro número de entrada $2 + i$. Esto colocará la flecha roja transformada en la misma relación geométrica con el número de entrada.
El resultado (la flecha roja escalada) cae en $5 + 5i$, que es lo que obtienes cuando los multiplicas algebraicamente. Debido a que los triángulos son similares, el ángulo se mantiene. El módulo del resultado es $|5 + 5i| = 5\sqrt2$, y el $|2 + i| = \sqrt5$, por lo que su relación es, como se esperaba, $\sqrt{10}$.
Creo que puedes ver cómo hay un sentido en el que esta extensión de la noción de multiplicación tal como está definida en los números reales conserva la semántica original.
Por lo tanto, el efecto general es que hay una escala y una rotación. Si el número por el que estás multiplicando cae en alguna parte del círculo unitario, entonces es solo una rotación; debido a que el módulo es $1$, no hay escala.
En particular, el efecto de multiplicar por $i$ es una rotación CCW de $90^\circ$.
En ese sentido, hay otra forma de verlo: voy a tomar prestadas algunas imágenes de este artículo de Kalid Azad, ya que estas corresponden más estrechamente a cómo llegas allí algebraicamente.
Toma dos números complejos en sus formas polares, $$ z := \alpha e^{i \theta} \qquad w := \beta e^{i \varphi} $$ (Aquí, $\alpha,\beta$ son sus magnitudes, y $\theta,\varphi$ los ángulos que forman con el eje real positivo hasta un múltiplo de $2\pi$.)
Entonces $$ zw = \alpha \beta e^{i(\theta+\varphi)} $$ Piensa en lo que esto significa para $z$ y $w$. Multiplicar $z$ por $w$ (cuando uno piensa en $z$ como un vector, es decir, una flecha que apunta desde el origen a $z$ en el plano) estira $z$ por un factor de $\beta$, y luego lo gira por un ángulo de $\varphi$ radianes alrededor del origen.
Es decir, la multiplicación es naturalmente una operación de estirar y rotar.
3Blue1Brown discute esto en más detalle entre otros temas en un livestream pasado aquí.
En primer lugar, los números complejos son bidimensionales, con componentes x (real) e y (imaginaria) independientes. Esto hace posible definir una "rotación", lo cual realmente no puedes hacer con números reales unidimensionales (a menos que cuentes cambiar el signo).
Sin embargo, esta propiedad no es única de los números complejos. También funciona con vectores ordinarios de $\mathbb{R}^2$, utilizando la transformación de coordenadas rectangulares-polares estándar:
$$x = r \cos\theta; y = r \sin\theta$$ $$r = \sqrt{x^2 + y^2}; \theta = \operatorname{atan2}(y, x)$$
Puedes rotar el vector $(x, y) = (r\cos\theta, r\sin\theta)$ ajustando el ángulo $\theta$ mientras dejas la longitud $r$ igual.
$$(x' = r \cos(\theta+\phi), y' = r \sin(\theta + \phi))$$
O puedes multiplicar el vector por un escalar real $a$, para estirar/reducir su longitud mientras conservas el ángulo.
$$(x' = ar\cos\theta, y' = ar\sin\theta)$$
También puedes hacer esto con $\mathbb{C}$, pero obtienes una operación adicional: La capacidad de multiplicar números complejos entre sí en lugar de solo por escalares reales. Esto se define como:
$$(a + ib)(c + id) = (ac - bd) + i(ad + bc) $$
Pero algo interesante sucede cuando multiplicas dos números escritos en coordenadas polar.
Un punto menor de notación: Para números complejos, el vector $(x, y)$ se escribe convencionalmente como $x + iy$. Aplicando la transformación de coordenadas, esto es equivalente a $r\cos\theta + ir\sin\theta = r(\cos\theta + i\sin\theta)$. Para abreviar, definamos $\operatorname{cis}\theta = \cos\theta + i \sin\theta$.
Ahora, consideremos los dos números complejos:
$$z = r\operatorname{cis}\alpha = r\cos\alpha + ir\sin\alpha$$ $$w = s\operatorname{cis}\beta = s\cos\beta + is\sin\beta$$
Al multiplicarlos obtenemos:
$$zw = (r\cos\alpha + ir\sin\alpha)(s\cos\beta + is\sin\beta)$$ $$=rs\cos\alpha\cos\beta + irs\cos\alpha\sin\beta + irs\sin\alpha\cos\beta - rs\sin\alpha\sin\beta $$ $$= rs (\cos\alpha\cos\beta - \sin\alpha\sin\beta + i(\cos\alpha\sin\beta + \sin\alpha\cos\beta)) $$ $$= rs (\cos(\alpha + \beta) + i\sin(\alpha + \beta)) $$ $$= rs \operatorname{cis}(\alpha + \beta) $$
Multiplicar dos números complejos suma sus ángulos. Eso es interesante.
Si multiplicamos un número complejo por sí mismo, la fórmula anterior nos da:
$$(r \operatorname{cis} \theta)^2 = r^2\operatorname{cis}(2\theta)$$
Se puede demostrar que este resultado se generaliza a:
$$\boxed{(r \operatorname{cis} \theta)^n = r^n\operatorname{cis}(n\theta)}$$
Esto se llama la Fórmula de DeMoivre, y es útil para encontrar potencias y raíces de números complejos. Y eso es por qué nos importan los ángulos de los números complejos.
- Ver respuestas anteriores
- Ver más respuestas