Debido a $M$ es bastante general, y el cambio en la similitud del coseno depende de la $A$ $B$ y su relación con la $M$, no definida fórmula es posible. Sin embargo, no hay prácticamente computable límites a la cantidad de la similitud del coseno puede cambiar. Se pueden encontrar por extremizing el ángulo entre el $MA$ $MB$ dado que la similitud del coseno entre el $A$ $B$ es un valor especificado, decir $\cos(2\phi)$ (donde $2\phi$ es el ángulo entre el$A$$B$). La respuesta nos dice cuánto cualquier ángulo $2\phi$, posiblemente, puede ser doblada por la transformación de $M$.
Los cálculos amenazar a ser desordenado. Algunos inteligentes opciones de notación, junto con algunos preliminar simplificaciones, reducir el esfuerzo. Resulta que la solución en dos dimensiones revela todo lo que necesitamos saber. Este es un problema manejable, dependiendo únicamente de una variable real $\theta$, que es fácilmente resuelto mediante técnicas de Cálculo. Un geométrica simple argumento se extiende esta solución a cualquier número de dimensiones $n$.
Matemática preliminares
Por definición, el coseno del ángulo entre dos vectores $A$ $B$ es obtenido mediante la normalización de ellos a la longitud de unidad y de sacar su producto. Por lo tanto,
$$\frac{A^\prime B}{\sqrt{(A^\prime A)\, (B^\prime B)}} = \cos(2\phi)$$
y, escribir $\Sigma = M^\prime M$, el coseno del ángulo entre las imágenes de $A$ $B$ menos que la transformación de $M$ es
$$\frac{(MA)^\prime (MB)}{\sqrt{((MA)^\prime (MA))\, ((MB)^\prime (MB))}} = \frac{A^\prime \Sigma B}{\sqrt{(A^\prime \Sigma A) (B^\prime \Sigma B)}}.\tag{1}$$
Observe que sólo se $\Sigma$ es importante en el análisis, no $M$ sí. Por consiguiente, se puede aprovechar la Descomposición de Valor Singular (SVD) de $M$ a simplificar el problema. Recordemos que este expresa $M$ como producto (de derecha a izquierda) de una matriz ortogonal $V^\prime$, una matriz diagonal $D$, y otro ortogonal de la matriz $U$:
$$M = U\,D\,V^\prime.$$
En otras palabras, existe una base de vectores privilegiados $e_1, \ldots, e_n$ (las columnas de a $V$) en que $M$ hechos por el reescalado de cada $e_i$ separado por el $i^\text{th}$ diagonal de entrada de $D$ (que voy a llamar a $d_i$) y después de la aplicación de una rotación (o anti-rotación) $U$ al resultado. Que final de la rotación no cambia nada en longitudes o ángulos y por lo tanto no debe afectar a $\Sigma$. Usted puede ver esto formalmente con el cálculo
$$\Sigma = M^\prime M = (U D V^\prime)^\prime (U D V^\prime) = V D (U^\prime U) D V^\prime = V D^2 V^\prime.$$
En consecuencia, el estudio de $\Sigma$ libremente podemos reemplazar $M$ por cualquier otra matriz que produce los mismos valores en $(1)$. Por orden de la $e_i$, de modo que el $d_i$ disminución en el tamaño (y asumiendo $M$ no es idéntica a cero), una buena opción de $M$ es
$$M = \frac{1}{{d_1}} D V^\prime.$$
Los elementos de la diagonal de a $(1/{d_1})D$
$$1 = d_1/d_1 \ge \lambda_2 = d_2/{d_1} \ge \lambda_3 = d_3/{d_1} \ge \cdots \ge \lambda_n = d_n/{d_1} \ge 0.$$
Específicamente, el efecto de la $M$ (ya sea en su estado original o cambiado de forma) en todos los ángulos está totalmente determinado por el hecho de que
$$M e_i = \lambda_i e_i.$$
Análisis de un caso especial
Deje $n=2$. Porque el cambio de las longitudes de los vectores de no cambiar el ángulo entre ellos, podemos suponer que $A$ $B$ son vectores unitarios. En el plano de todos estos vectores pueden ser designados por el ángulo que hacer con $e_1$, lo que nos permite escribir
$$A = \cos(\theta-\phi)e_1 + \sin(\theta-\phi)e_2.$$
Por lo tanto
$$B = \cos(\theta+\phi)e_1 + \sin(\theta+\phi)e_2.$$
(Ver la figura siguiente).
La aplicación de $M$ es muy sencillo: se fija el primer coordenadas de $A$ $B$ y multiplica su segundo coordenadas por $\lambda_2$. Por lo tanto, el ángulo de $MA$ $MB$es
$$f(\theta) = \arctan(\lambda_2 \tan(\theta+\phi)) - \arctan(\lambda_2 \tan(\theta-\phi)).$$
Debido a $M$ es una función continua, esta diferencia de ángulos es una función continua de la $\theta$. De hecho, es diferenciable. Esto nos permite encontrar los ángulos extremos por la inspección de los ceros de la derivada $f^\prime(\theta)$. Que derivado es fácil de calcular: se trata de un cociente de funciones trigonométricas. Los ceros sólo puede ocurrir entre los ceros de su numerador, así que no molesta para calcular el denominador. Obtenemos
$$f^\prime(\theta) = \frac{\lambda_2(1-\lambda_2)(\lambda_2+1)\sin(2\theta)\sin(2\phi)}{*}.$$
Los casos especiales de $\lambda_2=0$, $\lambda_2=1$,y $\phi=0$ son fáciles de entender: que corresponden a las situaciones donde la $M$ es de rango reducido (y así calabazas de todos los vectores en una línea); donde: $M$ es un múltiplo de la matriz de identidad; y donde $A$ $B$ son paralelas (de donde es el ángulo entre ellos no puede cambiar, independientemente de $\theta$). El caso de $\lambda_2=-1$ es impedido por la condición de $\lambda_2 \ge 0$.
Aparte de estos casos especiales, los ceros se producen sólo cuando $\sin(2\theta)=0$: $\theta=0$ o $\theta=\pi/2$. Esto significa que la línea determinada por $e_1$ biseca el ángulo de $AB$. Ahora sabemos que los valores extremos del ángulo entre el $MA$ $MB$ debe estar entre los valores de $f(\theta)$, así que vamos a calcularlos:
$$\eqalign{
f(0) &= \arctan(\lambda_2 \tan(\phi)) - \arctan(\lambda_2 \tan(-\phi)) = 2\arctan(\lambda_2\tan(\phi)); \\
f(\pi/2) &= \arctan(\lambda_2 \tan(\pi/2+\phi)) - \arctan(\lambda_2 \tan(\pi/2-\phi)) = 2\arctan(\lambda_2\cot(-\phi)).
}$$
La correspondiente cosenos son
$$\cos(f(0)) = \frac{1 - \lambda_2^2 \tan(\phi)^2}{1 + \lambda_2^2 \tan(\phi)^2}\tag{2}$$
y
$$\cos(f(\pi/2)) = \frac{1 - \lambda_2^2 \cot(\phi)^2}{1 + \lambda_2^2 \cot(\phi)^2} = \frac{\tan(\phi)^2 - \lambda_2^2 }{\tan(\phi)^2 + \lambda_2^2}.\tag{3}$$
A menudo es suficiente para entender cómo se $M$ distorsiona los ángulos rectos. En este caso, $2\phi=\pi/2$, lo $\tan(\phi) = \cot(\phi) = 1$, lo que puede conectar en las anteriores fórmulas.
Tenga en cuenta que el menor $\lambda_2$ se convierte en la más extrema de estos ángulos ser y la mayor es la distorsión.
Esta figura muestra cuatro configuraciones de vectores $A$ $B$ separados por un ángulo de $2\phi = \pi/3$. El círculo unidad y su elíptica de la imagen en $M$ están sombreadas de referencia (con la acción de la $M$ uniformemente ajustaron para hacer $\lambda_1=1$). La figura títulos indican el valor de $\theta$, el punto medio de la $A$$B$. El más cercano de cualquier $A$ $B$ puede venir cuando transformados por $M$ es una configuración como la de la izquierda con $\theta=0$. El más aparte de que puede ser una configuración como la de la derecha con $\theta=\pi/2$. Dos intermedios posibilidades se muestran.
La solución para todas las dimensiones
Hemos visto cómo $M$ actúa mediante la expansión de cada dimensión $i$ por un factor de $\lambda_i$. Esto distorsionará la unidad de la esfera de $\{A\,|\, A^\prime A = 1\}$ a un elipsoide. El $e_i$ determinar sus ejes principales. El $\lambda_i$ son las distancias desde el origen, a lo largo de estos ejes, el elipsoide. En consecuencia, el más pequeño, $\lambda_n$, es la distancia más corta (en cualquier dirección) desde el origen hasta el elipsoide y el más grande, $\lambda_1$, es la distancia más lejana (en cualquier dirección) desde el origen hasta el elipsoide.
En las dimensiones superiores $n\gt 2$, $A$ y $B$ son parte de una de dos dimensiones en el subespacio. $M$ mapas del círculo unidad en este subespacio en la intersección del elipsoide con un plano que contiene a$MA$$MB$. Esta intersección, siendo una distorsión lineal de un círculo, es una elipse. Obviamente la distancia más lejana a esta elipse no es más que $\lambda_1=1$, y la menor distancia es de no menos de $\lambda_n$.
Como hemos observado al final de la sección anterior, la más extrema posibilidad es al $A$ $B$ se encuentran en un plano que contiene dos de las $e_i$ de que la proporción correspondiente de la $\lambda_i$ es tan pequeño como sea posible. Esto sucederá en el $e_1, e_n$ plano. Ya tenemos la solución para ese caso.
Conclusiones
Los extremos de similitud del coseno alcanzable mediante la aplicación de $M$ a los dos vectores que tengan similitud del coseno $\cos(2\phi)$ se dan por $(2)$$(3)$. Ellos son alcanzados por situar $A$ $B$ a los ángulos iguales a una dirección en la que $\Sigma=M^\prime M$ máximo alarga cualquier vector (tales como el $e_1$ dirección) y la separación de ellos en una dirección en la que $\Sigma$ mínimamente alarga cualquier vector (tales como el $e_n$ dirección).
Estos extremos puede ser calculado en términos de la SVD de a $M$.