Aunque el título parece bastante clara, me gustaría comenzar con una discusión de cómo me vino personalmente para derivar la Forma Normal de Jordan, porque mi pregunta es muy específica para los detalles de la derivación.
La notación
Para empezar, vamos a $X$ ser un número finito de dimensiones de espacio vectorial, $L(X)$ ser el espacio de los operadores lineales en $X$, e $A\in L(X)$. Deje $\sigma(A) = \{\lambda_1,\ \cdots,\ \lambda_k\}$ ser el espectro de $A$. Ahora, tenemos que definir
- $d(\lambda)$ a ser el geométrica multiplicidad de $\lambda$
- $m(\lambda)$ a la algebraica multiplicidad de $\lambda$
A continuación, nos indican el $k$th generalizada subespacio propio de $\lambda$ por $$ \text{N}_k(\lambda) = \text{Ker}(A-\lambda I)^k $$ y por último, nos vamos a $$ \text{N}(\lambda) = N_{n(\lambda)}(\lambda)\qquad n(\lambda)=\min\{k\in\mathbb{N}\ |\ \text{N}_k(\lambda)=N_{k+1}(\lambda)\} $$ tomamos nota de que se puede demostrar que $n(\lambda) = m(\lambda)$, y así la notación $n(\lambda)$ no se puede utilizar.
También le vamos a $\sum_\lambda$, $\prod_\lambda$, etc. representan la suma de los productos//etc. sobre distintos autovalores de a $A$.
Fundamentos
En primer lugar, es sabido que podemos descomponer $X$ $$ X = \text{N}(\lambda_1)\oplus\cdots\oplus\text{N}(\lambda_k) $$ Por lo tanto $\sum_{\lambda} \dim\ \text{N}(\lambda) = \dim X$. También, desde el polinomio característico de a $A$, la suma de las multiplicidades algebraica de los valores debe ser igual al grado del polinomio, que es $\dim X$. Así $$ \sum_\lambda\dim\ \text{N}(\lambda) = \sum_\lambda m(\lambda) = \dim X $$ Ir en una dirección diferente, presentamos el siguiente teorema:
Teorema: Si $B\in L(X)$ es nilpotent de orden $n$, e $S\subset X\backslash\text{Ker} B^{n-1}$ es linealmente independiente, entonces $$ \bigcup_{x\in S}\{x,\ Bx,\ B^2x,\ \cdots,\ B^{n-1}x\} $$ es linealmente independiente.
Prueba: vamos a mostrar el caso de $|S|=2$, y el caso general sigue el mismo formato. Supongamos $S = \{x,\ y\}$, y $$ \sum_{k=0}^{n-1} a_k B^kx_1 + \sum_{k=0}^{n-1}b_k B^kx_2 = 0 $$ la aplicación de $B^{n-1}$ a ambos lados da $$ B^{n-1}\left(\sum_{k=0}^{n-1}a_kB^kx_1+b_kB^kx_2\right) = a_0B^{n-1}x_1+b_0B^{n-1}x_2 = B^{n-1}(a_0x_1+b_0x_2) = 0 $$ por lo $a_0x_1 + b_0x_2\in\text{Ker}B^{n-1}$. Sin embargo, desde la $\text{Ker}B^{n-1}$ es un subespacio de $X$, podemos descomponer $X$ $X = \text{Ker}B^{n-1}\oplus Z$ para un espacio vectorial $Z$, por lo que $\{x_1,\ x_2\}\subset Z\backslash\{0\}$. Desde $Z$ es un subespacio, $a_0x_1+b_0x_2\in Z$. Decir que $a_0x_1+b_0x_2\in \text{Ker}B^{n-1}\cap Z$ es equivalente a decir $a_0x_1+b_0x_2 = 0$. Por la independencia lineal de $S$, $a_0=b_0=0$. Este proceso se puede repetir para obtener $a_j=b_j=0$ para todos los $j$. $\blacksquare$
Ahora, tome $x\in \text{N}(\lambda)\backslash \text{N}_{m(\lambda)-1}(\lambda)$. Tenga en cuenta que $B_\lambda = (A - \lambda I)|_{\text{N}(\lambda)}$ (es decir, $A - \lambda I$ restringido a $\text{N}(\lambda)$) es nilpotent de orden $m(\lambda)$. Por lo tanto $\{x,\ B_\lambda x,\ \cdots,\ B_\lambda^{m(\lambda)-1}x\}$ es linealmente independiente, y el span es un subespacio de $\text{N}(\lambda)$. Por lo tanto $\dim \text{N}(\lambda) \ge m(\lambda)$.
Si suponemos que $\dim\text{N}(\lambda) > m(\lambda)$ durante al menos un $\lambda\in\sigma(A)$, luego nos contradice el hecho de que $\sum_\lambda\dim\text{N}(\lambda) = \dim X$, y así llegamos a la conclusión de que $m(\lambda) = \dim\text{N}(\lambda)$.
Bien, hasta ahí todo bien espero que...
Forma Normal De Jordan
Por los argumentos anteriores, llegamos a la conclusión de que $\text{Span}\{x,\ \cdots,\ B^{m(\lambda)-1}x\} = \text{N}(\lambda)$. Por lo tanto, si dejamos $e_0(\lambda)\in N(\lambda)\backslash N_{m(\lambda)-1}(\lambda)$, e $e_k(\lambda)=(A-\lambda I)^k e_0(\lambda)$, luego $$ \text{Span}\left(\bigcup_{\lambda}\bigcup_{k=0}^{m(\lambda)-1}\{e_k(\lambda)\}\right) = X $$
Desde $X = \text{N}(\lambda_1)\oplus\cdots\oplus\text{N}(\lambda_k)$, y cada una de las $\text{N}(\lambda_k)$ $A$- invariante (que es $A(\text{N}(\lambda_k))\subseteq \text{N}(\lambda_k)$), se sigue que, si tenemos bases para cada una de las $N(\lambda_i)$, entonces podemos obtener la siguiente representación de la matriz de $A$ respecto de la unión de estas bases: $$ A = \left[\begin{matrix} A|_{\text{N}(\lambda_1)} & O & \cdots & \vdots \\ O & A|_{\text{N}(\lambda_2)} & \cdots & \vdots \\ \vdots & \vdots & \ddots & \vdots \\ \cdots & \cdots & \cdots & A|_{\text{N}(\lambda_k)} \end{de la matriz}\right] $$ donde $A|_{\text{N}(\lambda_i)}$ es la representación de la matriz de $A$ restringido a $\text{N}(\lambda_i)$ respecto de la base de $\text{N}(\lambda_i)$.
Anteriormente, hemos demostrado que la $\{e_{m(\lambda)-1}(\lambda),\ \cdots,\ e_1(\lambda)\}$ es una base para $\text{N}(\lambda)$. Podemos encontrar una representación de la matriz de $A|_{\text{N}(\lambda_i)}$ señalando que $$ Ae_k(\lambda) = a(a-\lambda I)^ke_1(\lambda) = (A-\lambda I)^{k+1}e_1(\lambda) + \lambda(A-\lambda I)^ke_1(\lambda) \\ Ae_k(\lambda) = e_{k+1}(\lambda)+\lambda e_k(\lambda) \\ Ae_{m(\lambda)-1}(\lambda) = \lambda e_{m(\lambda)-1}(\lambda) $$ y así $$ Un|_{N(\lambda)} = \left[\begin{matrix} \lambda & 1 & 0 & \cdots & 0 \\ 0 & \lambda & 1 & \cdots & 0 \\ 0 & 0 & \lambda & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & 1 \\ 0 & 0 & 0 & \cdots & \lambda \end{de la matriz}\right] $$
Estos $A|_{N(\lambda)}$ son los Bloques de Jordan, y la representación de la matriz de $A$ anterior es la Forma Normal de Jordan.
Pregunta Principal
Estoy bastante contento con este derivación, nada parece confuso o fuera de lugar o contradictorios o nonrigorous, al menos en un nivel superficial. Yo no estaría haciendo esta pregunta, si no me vaya a la página de la Wikipedia sobre la Forma Normal de Jordan y ver esta línea:
El número de Jordania bloques correspondientes a $\lambda$ de tamaño, al menos,$j$$\dim \text{Ker}(A - \lambda I)^j - \dim \text{Ker}(A - \lambda I)^{j-1}$.
Mi "derivación" no tiene en cuenta el hecho de que no pueden ser múltiples Jordania Bloques correspondientes a un mismo autovalor. Así, en el sentido más amplio posible, ¿por qué? Lo que no me cuenta?
Mi idea era que yo "supone" que $\text{Span}\{x,\ \cdots,\ \text{B}_\lambda^{m(\lambda)-1}x\} = \text{N}(\lambda)$. Si hay más elementos en la base de $\text{N}(\lambda)$ de este valor, hay más bloques de Jordan. Pero si $\text{N}(\lambda)>m(\lambda)$, entonces la descomposición de la $X$ en la suma directa de la generalizada subespacios propios falla, ya que las dimensiones no se suman. Mi única otra conjetura es que $\{x,\ \cdots,\ \text{B}_\lambda^{m(\lambda)-1}x\}$ puede ser "roto" en algún sentido en la unión de las bases más pequeñas que , a continuación, producir más bloques de Jordan, pero no acabo de ver donde ir con eso.
Cualquier ayuda se agradece. Gracias por su tiempo!