Es un poco más fácil descifrar la geometría si cambias a coordenadas homogéneas† y expresas la transformación como un producto matricial: $$\mathbf x' = H\mathbf x = \begin{bmatrix}e_1&f_1&g_1\\e_2&f_2&g_2\\e_0&f_0&g_0\end{bmatrix} \begin{bmatrix}x\\y\\1\end{bmatrix}.$$ Recordando que las columnas de una matriz de transformación son las imágenes de los vectores base, podemos ver inmediatamente que $H$ asigna el origen de coordenadas de la imagen de origen al punto de la imagen de destino $(g_1/g_0,g_2/g_0)$ (suponiendo que $g_0\ne0$ es decir). La primera columna es la imagen de $(1,0,0)^T$ Así que asumiendo que el $x$ - y $y$ -Los ejes son horizontales y verticales en la imagen de origen, $v_x=(e_1/e_0, e_2/e_0)$ es el punto de fuga en el destino de las líneas horizontales en el origen. Es decir, las líneas horizontales de la imagen de origen se convierten en líneas que convergen en $v_x$ . Si $e_0=0$ entonces $v_x$ es un punto en el infinito, por lo que $H$ mapea líneas horizontales paralelas a líneas paralelas, aunque ahora serán paralelas al vector $(e_1,e_2)$ en lugar de horizontal. Del mismo modo, la segunda columna de $H$ es el punto de fuga $v_y$ de líneas verticales en la imagen de origen. Así, por ejemplo, si se asigna el cuadrado $[-1,1]\times[-1,1]$ en la fuente al cuadrilátero $ABCD$ en la ilustración de abajo, una rejilla rectangular en ese cuadrado terminará pareciéndose a la de la ilustración.
Esta es también la imagen que se puede obtener tras tomar una foto del cuadrado reglado en ángulo oblicuo con una cámara estenopeica.
Observe cómo los extremos de las líneas de la cuadrícula no están espaciados uniformemente en la imagen. Las transformaciones proyectivas preservan las relaciones cruzadas de los puntos de una línea, y como los puntos de fuga horizontales y verticales de la imagen de destino son finitos (son, respectivamente, las intersecciones de las líneas $AB$ con $DC$ y de $AD$ con $BC$ ), el espacio entre pares de líneas de cuadrícula adyacentes ya no es uniforme. Es el mismo fenómeno que se observa en las fotos de vallas o vías de ferrocarril que se alejan en la distancia: a medida que la valla/las vías se alejan de la cámara, los postes/las corbatas parecen estar cada vez más juntos.
Normalmente, se puede construir esto homografía entre dos imágenes haciendo coincidir algún cuadrilátero convexo, no necesariamente un cuadrado o rectángulo, en una imagen con un cuadrilátero convexo en la otra. Hay una buena explicación de cómo construir la matriz $H$ dados los dos quads aquí . Sin embargo, hay otra forma de entender la cartografía que puede ser más esclarecedora.
Imagina que las dos imágenes se encuentran en un par de planos incrustados en la escena tridimensional. A continuación, puedes mapear la primera imagen en la segunda retroproyectándola en un tercer plano. plano de transferencia en la escena y, a continuación, se proyecta desde ella al segundo plano de la imagen. Existe una amplia literatura sobre las relaciones matemáticas entre pares de imágenes de la misma escena. Buscar geometría epipolar como punto de partida.
† No voy a dar más que una definición superficial, si es que la hay, de términos básicos que se pueden buscar fácilmente en Internet.