32 votos

La característica y el polinomio mínimo de una matriz compañera

La matriz de acompañamiento de un polinomio mónico $f \in \mathbb F\left[x\right]$ en $1$ variable $x$ sobre un campo $\mathbb F$ juega un papel importante en la comprensión de la estructura de la dimensión finita $\mathbb F[x]$ -módulos.

Es un hecho importante que el polinomio característico y el polinomio mínimo de $C(f)$ son ambos iguales a $f$ . Esto se puede ver fácilmente por inducción en el grado de $f$ .

¿Alguien conoce una prueba diferente de este hecho? Me encantaría ver una prueba teórica de grafos o una prueba algebraica no inductiva, pero me conformaría con cualquier cosa que haga que parezca algo más que una coincidencia.

24voto

GmonC Puntos 114

El hecho de que el polinomio mínimo de una matriz compañera $C(f)$ es $f$ es evidente, como se ha indicado anteriormente. El hecho de que su polinomio característico sea también $f$ es un ejercicio de cálculo clásico. El cálculo es preferible a la aplicación de Cayley-Hamilton porque este hecho puede utilizarse como ingrediente de una demostración elemental de ese teorema (al menos sobre campos) como se ha dicho anteriormente. A continuación daré un argumento más sencillo que no requiere módulos sobre un EPI.

Primero el cálculo del polinomio característico $$\left|\matrix{x&0&0&\ldots&a_0\\ -1&x&0&\ldots&a_1\\ 0&-1&x&\ldots&a_2\\ \vdots&\ddots&\ddots&\ddots&\vdots\\ 0 & \cdots & 0 & -1 & x+a_{n-1}}\right| . $$ Una forma es añadir la última fila $x$ veces a la fila anterior, entonces esa fila $x$ veces a la anterior y así sucesivamente hasta la primera fila, lo que resulta en un determinante de la forma $$\left|\matrix{0&0&0&\ldots&f\\ -1&0&0&\ldots&*\\ 0&-1&0&\ldots&*\\ \vdots&\ddots&\ddots&\ddots&\vdots\\ 0 & \cdots & 0 & -1 & *}~\right| = f $$ donde el polinomio $f$ en la parte superior derecha se obtiene, de hecho, como en un esquema de Horner $f=a_0+x(a_1+x(\cdots(a_{n-2}+x(a_{n-1}+x))\cdots))$ .

Otro método es desarrollar la matriz por la primera fila, y aplicar la inducción sobre el tamaño. El menor que el $x$ se multiplica por es de nuevo una matriz compañera, pero para el polinomio $(f-a_0)/x=a_1+a_2x+\cdots+a_{n-1}x^{n-2}+x^{n-1}$ y el coeficiente $a_0$ se multiplica por $(-1)^{n-1}$ veces el determinante de una matriz triangular superior de tamaño $n-1$ con todas las entradas diagonales $-1$ , lo que da $a_0$ En el caso inicial, la matriz de este tipo para el polinomio $a+x$ es un $1\times1$ matriz con $x+a$ como coeficiente. De nuevo el polinomio se encuentra como en un esquema de Horner.

Otra forma es escribir el determinante como $$ x^n+\left|\matrix{x&0&0&\ldots&a_0\\ -1&x&0&\ldots&a_1\\ 0&-1&x&\ldots&a_2\\ \vdots&\ddots&\ddots&\ddots&\vdots\\ 0 & \cdots & 0 & -1 & a_{n-1}}\right| $$ y desarrollar por la última columna, observando que el cofactor por el cual la entrada $a_k$ se multiplica es $(-1)^{n-1-k}$ veces un menor que tiene una descomposición en bloque $M=\left|{L\atop0}~{0\atop{U}}\right|$ donde $L$ es una matriz triangular inferior de tamaño $k$ con entradas $x$ en la diagonal, y $U$ es una matriz triangular superior de tamaño $n-1-k$ con entradas $-1$ en la diagonal, haciendo que el cofactor $x^k$ y el polinomio característico $f$ .

Ahora la demostración elemental del teorema de Cayley-Hamilton. Se procede por inducción en $n$ el caso $n=0$ siendo trivial. Para $n>0$ tomar un vector no nulo $v$ y que $V$ sea el subespacio generado por sus imágenes repetidas bajo la transformación lineal $\phi$ que tiene una base $v,\phi(v),\ldots,\phi^{d-1}(v)$ donde $d=\dim(V)>0$ es el grado del polinomio mínimo $P$ que aniquila $v$ cuando se actúa por $\phi$ . Extender a una base de todo el espacio, en cuya base $\phi$ tiene una matriz de la forma $M=\left({A\atop0}~{{*}\atop{B}}\right)$ , donde $A$ es la matriz compañera de $P$ .

Uno tiene $\chi_M=\chi_A\chi_B$ , donde $\chi_A=P$ por el cálculo anterior. Ahora se obtienen matrices nulas al evaluar $P$ en $A$ (porque $P$ es su polinomio mínimo) y (por inducción) al evaluar $\chi_B$ en $B$ . Así, la evaluación de $\chi_M=P.\chi_B$ en $M$ da un producto matricial que en forma de bloque es $\left({0\atop0}~{{*}\atop{*}}\right)\cdot\left({{*}\atop0}~{{*}\atop0}\right) =\left({0\atop0}~{0\atop0}\right)$ . Tenga en cuenta que una no puede utilizar la hipótesis de inducción para $A$ La pregunta es: ¿se puede tener $d=n$ , en cuyo caso $A$ no es menor que el caso que se está probando actualmente (de hecho, este será el caso para las elecciones "genéricas" de $M$ y $v$ ). Por lo tanto, tratar explícitamente el caso de la matriz compañera es realmente necesario en esta línea de razonamiento.

19voto

John Fouhy Puntos 759

Suponga que su matriz está sobre un campo $\mathbb{F}$ . Mira $G = \mathbb F[x]/f$ , donde $f$ es su polinomio de grado $n$ . Entonces $G$ es un espacio vectorial sobre $\mathbb{F}$ y $C(f)$ es la matriz (con respecto a la base $1,x,x^2,\ldots,x^{n-1}$ ) correspondiente al operador lineal $g \mapsto x \cdot g$ .

Desde $f = 0$ en $G$ También $fx^i = 0$ en $G$ y así $f$ es un polinomio de grado $n$ tal que $f(C(f)) = 0$ . Además, cualquier polinomio $g$ de menor grado no se reduce a $0$ en $G$ Así que, en particular $g(C(f))$ aplicada al vector $1$ no es igual al vector cero. Así que $f$ es el polinomio mínimo de $C(f)$ . Como tiene grado $n$ debe ser el polinomio característico.

1 votos

¿No debería tu "por lo tanto debe ser el polinomio característico de $C(f)$ " sea "así $f$ es divisible por el polinomio mínimo de $C(f)$ "?

0 votos

@Mariano: ambos polinomios tienen el mismo grado.

8 votos

@YuvalFilmus: Mariano tiene razón, es extraño concluir que el polinomio que aniquila $C(f)$ debe ser su polinomio característico, y más tarde concluir que también debe ser el polinomio mínimo porque ese tiene grado $n$ también. El razonamiento adecuado es: $f$ es el polinomio mínimo porque se aniquila y ningún polinomio de grado inferior lo hace; dado esto se deduce por Cayley-Hamilton que también es el polinomio característico.

12voto

Esta es esencialmente la respuesta de Yuval expresada de una manera ligeramente diferente. Que su matriz de acompañamiento sea $$C=\pmatrix{0&1&0&\cdots&0\\\\ 0&0&1&\cdots&0\\\\ \vdots&\vdots&\vdots&\ddots&\vdots\\\\ 0&0&0&\cdots&1\\\\ -a_0&-a_1&-a_2&\cdots&-a_{n-1}}.$$ Entonces para el vector $v=(1\,\,0\,\,0\cdots 0)$ , $$v\sum_{j=0}^{n-1} b_j C^j= \pmatrix{b_0&b_1&b_2&\cdots&b_{n-1}}$$ para que $g(C)\ne0$ para todos los polinomios no nulos $g$ de grado inferior a $n$ . Así que el polinomio mínimo tiene grado $n$ y es igual al polinomio característico (vía Cayley-Hamilton). Pero $vC^n=(-a_0\,\, {-a_1}\,\, {-a_2}\cdots{-a_{n-1}})$ y para $v(C^n+\sum_{j=0}^{n-1}b_j C^j)=0$ necesitamos $a_j=b_j$ . Así que los polinomios mínimo y los polinomios característicos son ambos iguales $f$ .

0 votos

¿La respuesta de Yuval usa Cayley-Hamilton?

1 votos

Dice "por lo tanto debe ser el polinomio característico".

8voto

azimut Puntos 13457

Sorprendentemente, todavía falta la siguiente prueba (en mi opinión) bastante elegante:

Mira el $F$ -espacio vectorial $F[x]/(f)$ . El mapa $$\phi : F[x]/(f)\to F[x]/(f),\quad g + (f)\mapsto x\cdot g + (f)$$ está bien definido y $F$ -lineal.

Dejemos que $m_\phi = \sum_{i=0}^d a_i x^i\in F[x]$ sea el polinomio mínimo y $\chi_\phi\in F[x]$ el polinomio característico de $\phi$ . Entonces $m_\phi(\phi)$ es el mapa cero en $\operatorname {End}(F[x]/(f))$ . Así, $$0 + (f) = m_\phi(\phi)(1 + (f)) = \sum_{i=0}^d a_i \phi^i(1 + (f)) = \left(\sum_{i=0}^d a_i x^i\right) + (f) = m_\phi + (f).$$

Así que $$f\mid m_\phi \mid \chi_{\phi},$$ donde la segunda divisibilidad se deduce de Cayley-Hamilton. Debido a $m_\phi \neq 0$ y $\deg(f) = \dim_F(K[x]/(f)) = \deg(\chi_\phi)$ y como todos los polinomios son mónicos, esto obliga a $$ f = m_\phi = \chi_\phi.$$

Con respecto a la base $(1 + (f), x + (f),\ldots, x^{n-1} + (f))$ la matriz de transformación de $\phi$ es la matriz de acompañamiento $C(f)$ de $f$ . Por tanto, el polinomio mínimo de $C(f)$ es igual a $m_\phi$ y el polinomio característico de $C(f)$ es igual a $\chi_\phi$ .

2voto

Chris Porter Puntos 838

Hoy he estado pensando un poco en el problema. Lo que Robin y Yuval han demostrado es que si el teorema de Cayley-Hamilton es cierto, entonces la característica y el polinomio mínimo de $C(f)$ son ambos iguales a $f$ .

A la inversa, supongamos que para todo $f \in F[x]$ la característica y el polinomio mínimo de $C(f)$ son ambos iguales a $f$ .

Dejemos que $V$ sea una dimensión finita $F$ -y el espacio vectorial $T : V \to V$ una transformación lineal. sabemos por el teorema de clasificación de los módulos sobre PIDs que existe una base $B$ de $V$ y $f_1, \dots, f_s \in F[x]$ tal que $f_1 \mid \dots \mid f_s$ y

$$ [T]_B = \begin{pmatrix} C(f_1) & & \\ & \ddots & \\ & & C(f_s) \\ \end{pmatrix} := M$$

Es evidente que el polinomio característico de $M$ es el producto de los polinomios característicos de todos los $C(f_i)$ s y el polinomio mínimo de $M$ es el mínimo común múltiplo de los polinomios mínimos de todos los $C(f_i)$ s. Vemos que la suposición de que el polinomio característico de $T$ es $f_1 f_2 \dots f_s$ y el polinomio mínimo de $T$ es $f_s$ . Esto demuestra el teorema de Cayley-Hamilton.

Esto demuestra que el teorema de Cayley-Hamilton es equivalente al hecho de que "para todo $f \in F[x]$ la característica y el polinomio mínimo de $C(f)$ son ambos iguales a $f$ ".

Demostrar el teorema de Cayley-Hamilton sin asumir conocimientos de módulos sobre EPIs o matrices acompañantes es bastante delicado (por lo que recuerdo del primer año de universidad).

Esto parece apoyar la idea de que para demostrar el teorema de Cayley-Hamilton (o el hecho de las matrices compañeras), hay que ensuciarse las manos en algún momento (ya sea calculando directamente los polinomios mínimos y característicos de una matriz compañera o pasando por una delicada demostración del teorema de Cayley-Hamilton).

0 votos

Hay varias formas agradables de probar Cayley-Hamilton sin hacer nada delicado. Como es una identidad polinómica, basta con demostrarla sobre algún campo de característica cero. Sobre C es obvio porque es obvio para matrices diagonalizables, y éstas son densas. Alternativamente, se puede trabajar "universalmente", es decir, en Z[x_{ij}]. Este método se demuestra aquí: mathoverflow.net/questions/32133/

0 votos

Sin embargo, todavía tengo muchas esperanzas de que alguien nos dé una prueba combinatoria :D

0 votos

@Qiaochu: ¡Supongo que mi último comentario fue un poco exagerado! Gracias por el argumento y el enlace

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X