10 votos

Coeficientes del polinomio característico

Dejemos que $A$ ser un $n\times n$ matriz. Entonces su polinomio característico es

$$\phi_A(x) = \det(xI - A) = x^n - (\operatorname{tr} A)x^{n-1} + \cdots + (-1)^{n-1}(\operatorname{tr}(\operatorname{adj}A))x + (-1)^n\det A,$$

donde $\operatorname{adj}A$ denota el matriz adjunta de $A$ .

Mi pregunta: ¿Por qué los coeficientes de $\phi_A$ ¿Los que se muestran arriba?

Puedo ver por qué $(-1)^n\det A$ es el término constante, ya que $$\det(A) = \phi_A(0) = (0-\mu_1)\cdots(0-\mu_n) = (-1)^n\mu_1\cdots\mu_n,$$

donde $\mu_i$ son las raíces ( $i=1,\dots,n$ ). También veo por qué el coeficiente de $x^{n-1}$ es menos la traza, ya que por la expansión de Laplace (a lo largo de la primera fila):

\begin{align*} &\det(xI-A)\\[10pt] &= \begin{vmatrix} x-a_{11} & -a_{12} & \cdots & -a_{1n}\\ -a_{21} & x-a_{22} & \cdots & -a_{2n}\\ \vdots & \vdots & \ddots & \vdots\\ -a_{n1} & -a_{n2} & \cdots & x-a_{nn} \end{vmatrix} |[10pt] &= (x-a_{11}) \begin{vmatrix} x-a_{22} & \cdots & -a_{2n}\\ \vdots & \ddots & \vdots\\ -a_{n2} & \cdots & x-a_{nn} \end{vmatrix} + \Nsubrayado{a_{12} \begin{vmatrix} -a_{21} & \cdots & -a_{2n}\\ \vdots & \ddots & \vdots\\ -a_{n1} & \cdots & x-a_{nn} \end{vmatrix} + \cdots}_{texto{a lo sumo polinomio de grado $n-2$ {{}}[10pt] &=(x-a_{11})\bigg((x-a_{22}) \begin{vmatrix} x-a_{33} & \cdots & -a_{3n}\\ \vdots & \ddots & \vdots\\ -a_{n3} & \cdots & x-a_{nn} \end{vmatrix} +\underbrace{\underbrace{a_{23} \begin{vmatrix} -a_{32} & \cdots & -a_{3n}\\ \vdots & \ddots & \vdots\\ -a_{n2} & \cdots & x-a_{nn} \end{vmatrix}+\cdots} Como máximo un polinomio de grado $n-3$ }} \bigg) + \cdots}_{texto{a lo sumo polinomio de grado $n-2$ &\kern10pt\vdots\\[10pt] &=(x-a_{11})(x-a_{22})\cdots(x-a_{nn}) + \cdots{{}de grado como máximo $n-2$ {}}[10pt] &= x^n - (a_{11}+a_{22}+\cdots + a_{nn})x^{n-1} + \cdots[10pt] &= x^n - (\operatorname{tr}A)x^{n-1} + \cdots \fin{align*} (Hágame saber si hay una forma más elegante de obtener esto).

Pero lo que no puedo demostrar es que el coeficiente de $x$ es $ (-1)^{n-1}\operatorname{tr}(\operatorname{adj}A)$ . Intentar trabajar con la expansión de Laplace (como hice para obtener la traza anterior) no me lleva a ninguna parte.

2 votos

La expansión de Leibniz parece casi hecha para demostrar esto.

4voto

Matthew Scouten Puntos 2518

Supongamos que primero $B$ es un $n \times n$ matriz con $\det(B) = 1$ . Entonces $\text{adj}(B) = B^{-1}$ y

$$ \phi_{B^{-1}}(x) = \det(x I - B^{-1}) = \det(x B - I) = (-x)^n \det(x^{-1} I - B) = (-x)^n \phi_B(1/x)$$

El coeficiente de $x^{1}$ en $\phi_B(x)$ es el coeficiente de $x^{-1}$ en $\phi_B(1/x)$ es decir $(-1)^n$ veces el coeficiente de $x^{n-1}$ en $(-x)^n \phi_B(1/x)$ pero se conoce el coeficiente de $x^{n-1}$ en $\phi_{B^{-1}}(x)$ es $\text{tr}(B^{-1})$ . Es decir, el coeficiente de $x^1$ en $\phi_B(x)$ es $(-1)^n \text{tr}(B^{-1}) = (-1)^n \text{tr}(\text{adj}\; B)$ .

Ahora dejemos que $A = t B$ , donde $t \ne 0$ . Entonces $\phi_A(x) = \det(x I - t B) = t^n \det((x/t)I - A) = t^n \phi_B(x/t)$ . El coeficiente de $x^1$ en $\phi_A(x)$ es entonces $t^{n-1}$ veces el coeficiente de $x^1$ en $\phi_B(x)$ . Pero también $\text{adj}\; A = t^{n-1} \text{adj}\; B$ . Así, obtenemos de nuevo que el coeficiente de $x^1$ en $\phi_A(x)$ es $(-1)^n \text{tr}(\text{adj}\; A)$ .

Toda matriz no singular $A = \det(A)^{1/n} B$ donde $\det(B) = 1$ por lo que la fórmula del coeficiente es válida para toda matriz no singular. (Nótese que en el caso de que $\det(A)$ es negativo y $n$ es par, debemos usar números complejos aquí, pero eso no es un problema)

Ahora el coeficiente de $x^1$ en $\phi_A(x)$ y $(-1)^n \text{tr}(\text{adj}\; A)$ son ambos polinomios en los coeficientes de $A$ .
Por lo tanto, la ecuación debe ser válida para todos los $n \times n$ matrices, no sólo las no singulares.

3voto

jlleblanc Puntos 2957

Esto puede derivarse fácilmente del Corolario 2 en https://math.stackexchange.com/a/3069061/ (aplicado a $-A$ en lugar de $A$ ) estableciendo $r = 1$ , $r = n-1$ o $r = n$ . Si sigues la referencia a mis notas, verás que básicamente hago el "expandir todo y extraer los coeficientes de las potencias apropiadas de $x$ " que ya hizo para el $x^{n-2}$ -y que @J_P esbozó para los demás coeficientes; lo único que hago diferente es formalizarlo.

Para otra prueba, véase mi nota El teorema de Cayley-Hamilton ( espejo temporal mientras el sitio web que se acaba de enlazar está fuera de línea), específicamente:

  • Corolario 2.4 (b) para el $x^0$ -siendo eficiente $\left(-1\right)^n \det A$ ;

  • El teorema 5.32 para la $x^1$ -siendo eficiente $\left(-1\right)^{n-1} \operatorname{Tr}\left(\operatorname{adj}A\right)$ ;

  • Corolario 3.22 para el $x^{n-1}$ -siendo eficiente $- \operatorname{Tr} A$ .

Nótese que mi objetivo en esa nota (al menos el objetivo original; la fluencia de características ha soportado toda la sección 5 y partes de las secciones anteriores) es no para encontrar los coeficientes del polinomio característico, por lo que no estoy tomando ningún tipo de línea recta. No hay mucho que decir a favor de mi prueba, aparte de que evita los tejemanejes que suelen aparecer en el argumento estándar (expansión término a término).

0 votos

Siempre he querido ver esto hecho con más rigor, tendré que sentarme y leer detenidamente tu otro post. Por lo visto esto también se puede hacer con potencias exteriores pero no tengo ni idea de ellas, ¿tienes alguna referencia para ese tema?

0 votos

También he intentado formalizar el argumento, que he añadido a mi respuesta. Estaría muy agradecido si encontraras el tiempo para escanearlo rápidamente y decirme si te parece bien.

1 votos

@J_P: Irónicamente, es la parte de "Esto se puede demostrar rigurosamente observando" lo que no entiendo de tu demostración, pero por lo demás es un bonito esbozo de una demostración rigurosa sin demasiado dolor (y la parte que no entiendo se puede hacer por inducción). ¡Buen trabajo!

2voto

J_P Puntos 155

Defino $\phi_A(x)=\det(A-\lambda I)$ . El coeficiente se obtiene en $\lambda^{n-k}$ de la siguiente manera: elige $k$ entradas diagonales $a_{i_1i_1},...,a_{i_ki_k}$ . Estos definen un $k\times k$ menor de $A$ que se obtiene eliminando todas las filas y columnas que no contienen uno de los elementos diagonales elegidos. Calcula el determinante de este menor y suma sobre todos los $n\choose k$ selecciones de la $k$ entradas diagonales. Hasta el signo (que es sólo la alternancia) que es su $\lambda^{n-k}$ coeficiente.

Tengo que decir que no conozco una prueba formal precisa (EDIT: ir al final de la respuesta, ahora he añadido un intento de formalizar lo que sigue), me gusta ver esto de una manera más algorítmica. Así es como me convenzo: $$ \begin{vmatrix} a_{11}-\lambda & a_{12} & ... & a_{1n} \\ a_{21} & a_{22}-\lambda & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ...& a_{nn}-\lambda \end{vmatrix}=\\ =\begin{vmatrix} a_{11} & a_{12} & ... & a_{1n} \\ a_{21} & a_{22}-\lambda & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ...& a_{nn}-\lambda \end{vmatrix}-\lambda\begin{vmatrix} a_{22}-\lambda & ... & a_{2n} \\ ... & ... & ... \\ a_{n2} & ...& a_{nn}-\lambda \end{vmatrix} $$ Ahora ves que el problema se ha dividido en dos partes. Trata cada una por separado: en la primera, pasa a la siguiente columna y vuelve a dividir el determinante como $$ \begin{vmatrix} a_{11} & a_{12} & ... & a_{1n} \\ a_{21} & a_{22}-\lambda & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ...& a_{nn}-\lambda \end{vmatrix}=\begin{vmatrix} a_{11} & a_{12} & ... & a_{1n} \\ a_{21} & a_{22} & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ...& a_{nn}-\lambda \end{vmatrix}-\lambda\begin{vmatrix} a_{11} & ... & a_{2n} \\ ... & ... & ... \\ a_{n2} & ...& a_{nn}-\lambda \end{vmatrix} $$ Haz lo mismo con el segundo. Si sigues haciendo esto, aparecerá un gran número de determinantes ( $2^n$ en total - que no es más que la suma de los coeficientes binomiales $n\choose k$ , ya sugestivo). Se puede ver esto como un árbol de decisión: en cada paso, se dice si se quiere mantener el $i$ -a la columna o no. Después de elegir, no volverás a tocar las columnas anteriores. Por lo tanto, si haces esto, obtendrás determinantes cuadrados a los que les faltan algunas columnas. Si eliges algunas columnas (equivalentemente, algunos elementos diagonales) para eliminar, di "NO" a cada decisión en la que elimines una de las columnas deseadas y "SÍ" en caso contrario. Esto define un camino en el árbol binario que termina cuando no hay más $\lambda$ se quedan. Dado que cada selección de $k$ elementos diagonales corresponde exactamente a un camino en el árbol binario con $n-k$ "SÍ", obtendrá $(-1)^{n-k}\lambda^{n-k}$ delante de cada uno de esos determinantes y, por tanto, al sumarlos todos, se obtiene precisamente la suma de todos los centrados en la diagonal $k\times k$ determinantes.

En particular, se obtiene el término lineal eliminando sólo $1$ columna y fila y sumando sobre todas las posibilidades. Como se trata de determinantes de los menores principales que figuran en la definición de la matriz adjunta, lo que se calcula es simplemente la suma de los elementos diagonales de la adjunta, es decir, su traza.

Si no se cree toda esta palabrería (que es perfectamente razonable), le recomiendo encarecidamente que pruebe un $4\times 4$ caso ya que eso es sólo $16$ determinantes en total, o, si tiene mucho papel, el $5\times 5$ caso. Eso podría ayudarte a tener una "sensación" del patrón.

También creo que este mismo argumento se podría hacer más riguroso si se lanzaran algunos argumentos como "en el $i$ -ésima etapa, los determinantes de un determinado tamaño aparecerán a una determinada potencia de $\lambda$ " y tratar de hacer esto por inducción, pero nunca llegué a hacerlo así que es sólo una corazonada en este punto.


Así que intenté formalizar esto un poco y aquí está mi intento. Dejemos que $D(b_1,b_2,...,b_n)$ denotan los distintos determinantes que aparecerán, donde $b_i\in\{0,1,2\}$ . $b_i=0$ significa que se elimina el $i$ -en la fila y en la columna por completo, $b_i=1$ significa que sólo se elimina el $\lambda$ en $a_{ii}$ y $b_i=2$ significa "dejar el $i$ -ésimo elemento diagonal y su fila y columna tal cual". Por ejemplo: $$ D(2,2,2)=\begin{vmatrix} a_{11}-\lambda & a_{12} & a_{13} \\ a_{21} & a_{22}-\lambda & a_{23} \\ a_{31} & a_{32} & a_{33}-\lambda \end{vmatrix}\quad D(2,1,1)=\begin{vmatrix} a_{11}-\lambda & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{vmatrix}\\ D(2,1,0)=\begin{vmatrix} a_{11}-\lambda & a_{12}\\ a_{21} & a_{22} \end{vmatrix} $$ Tenemos la fórmula de reducción: $$D(b_1,...,2,...,b_n)=D(b_1,...,1,...,b_n)-\lambda D(b_1,...,0,...,b_n)$$ Comenzamos con $D(2_1,2_2,...,2_n)$ . Escriba $\bf{b}$ para el vector de $b_i$ y que $\Vert {\bf b}\Vert$ sea el número de $1$ 's en $\bf{b}$ . Si procedemos por inducción, podemos decir que $$D(0,2_1,...,2_{n-1})=\sum_{\dim{\bf b}=n-1\\\quad \,2\not\in{\bf b}}D(0,{\bf b})(-\lambda)^{n-1-\Vert{\bf b}\Vert}$$ Desde el $0$ en la parte delantera no juega ningún papel y la fórmula de reducción es la misma independientemente de lo que el primer $b_i$ es, debemos tener eso también: $$D(1,2_1,...,2_{n-1})=\sum_{\dim{\bf b}=n-1\\\quad \,2\not\in{\bf b}}D(1,{\bf b})(-\lambda)^{n-1-\Vert{\bf b}\Vert}$$ Esto se puede demostrar rigurosamente observando que si aplicamos la fórmula de reducción a $D(0,{\bf b})$ en algún índice, obtenemos lo mismo que si lo hiciéramos para $D(1\text{ or }2,{\bf b})$ pero para el primer índice. Aplicando la reducción inductiva sobre los índices, eliminamos todos los $2$ pero como en cada paso la fórmula es la misma salvo que cambiamos el primer índice, al final nos quedamos con fórmulas idénticas pero para el primer índice.
De todos modos, tenemos: $$ D(2_1,2_2,...,2_n)=D(1,2,...,2)-\lambda D(0,2,...,2)=\\ =\sum_{\dim{\bf b}=n-1\\\quad \,2\not\in{\bf b}}\left(D(1,{\bf b})(-\lambda)^{n-1-\Vert{\bf b}\Vert}+D(0,{\bf b})(-\lambda)^{n-\Vert{\bf b}\Vert}\right)=\sum_{\dim{\bf b}=n\\\,\,\,\,\, 2\not\in{\bf b}}D({\bf b})(-\lambda)^{n-\Vert{\bf b}\Vert} $$ Esto establece el paso inductivo y completa la prueba.


Debido a la útil sugerencia de @amd en los comentarios, he aquí una aproximación con la fórmula de Leibniz. Aquí, $N=\{1,...,n\}$ . \begin{align} &\det(A-\lambda I)=\sum_{\sigma\in\mathrm{Sym}(n)}\mathrm{sgn}(\sigma)\prod_{i=1}^n(a_{i\sigma(i)}-\lambda\delta_{i\sigma(i)})=\\ &=\sum_{\sigma\in\mathrm{Sym}(n)}\mathrm{sgn}(\sigma)\sum_{A\subset N}\prod_{i\in A}a_{i\sigma(i)}\prod_{j\in N-A}(-\lambda)\delta_{j\sigma(j)}=\\ &=\sum_{A\subset N}(-\lambda)^{n-\Vert A\Vert}\sum_{\sigma\in\mathrm{Sym}(n)}\mathrm{sgn}(\sigma)\prod_{i\in A}a_{i\sigma(i)}\prod_{j\in N-A}\delta_{j\sigma(j)} \end{align} En la última expresión tenemos que $\prod_{j\in N-A}\delta_{j\sigma(j)}$ que es $0$ a menos que $N-A$ contiene sólo puntos fijos de $\sigma$ - En otras palabras, sólo tenemos que sumar sobre $\sigma$ cuyos puntos fijos son un superconjunto de $N-A$ . Pero estas nuevas permutaciones forman un grupo que es esencialmente $\mathrm{Sym}(A)$ las permutaciones de $A$ . El signo de una permutación de longitud $m$ es $(-1)^k$ donde $k=m-\text{(number of disjoint cycles that make up $ \N - El sigma $)}$ - cuando dejamos los puntos estacionarios de $\sigma$ , $m$ disminuye, pero el número de ciclos disjuntos disminuye exactamente en la misma cantidad, ya que los puntos estacionarios corresponden a ciclos triviales. Por lo tanto, el signo sigue siendo el mismo y tenemos: $$ \det(A-\lambda I)=\sum_{A\subset N}(-\lambda)^{n-\Vert A\Vert}\sum_{\sigma\in\mathrm{Sym}(A)}\mathrm{sgn}(\sigma)\prod_{i\in A}a_{i\sigma(i)} $$ Pero las sumas sobre $\sigma\in\mathrm{Sym}(A)$ son ahora sólo determinantes de los principales menores y hemos terminado.

0 votos

Creo que la fórmula de Leibniz para los determinantes puede utilizarse para demostrarlo.

0 votos

Posiblemente, pero me da pavor pensar en usar esa fórmula, me parece realmente inmanejable.

0 votos

Es horrible para los cálculos, pero genial para las pruebas. En particular, su construcción es equivalente a escoger los términos que implican exactamente $n-k$ $\lambda$ 's.

1voto

user293121 Puntos 126

Las respuestas anteriores son excelentes y son un poco más generales de lo que tenía en mente, pero si sólo quería el coeficiente de $x$ en $\phi_A(x)$ Aquí hay una forma razonablemente sencilla de obtenerlo: este coeficiente es simplemente $\phi_A'(0)$ por lo que si escribimos $A(x)=xI-A$ buscamos la derivada de la función compuesta $\det(A(x))$ . Para cualquier matriz cuadrada $M$ , $\det(M)=\det(\{M_{i,j}\}_{i,j=1}^n)$ es alguna función polinómica de las entradas, y por la expansión del cofactor, podemos expandir a lo largo de cualquier fila $i$ para encontrar que $$\det(M)=\sum_{j=1}^n M_{i,j}C_{i,j},$$ donde $C_{i,j}$ es el $(i,j)$ cofactor de $M$ . Tenga en cuenta que esto no es una función de $M_{i,j}$ . En particular, para cualquier índice $i,k$ la regla del producto da $$\frac{\partial \det(M)}{\partial M_{i,k}}=\sum_{j=1}^n\frac{\partial M_{i,j}}{\partial M_{i,k}}C_{i,j}+M_{i,j}\frac{\partial C_{i,j}}{M_{i,k}}.$$ Pero a menos que $j=k$ El término $\partial M_{i,j}/\partial M_{i,k}=0$ (y es $1$ cuando $j=k$ ) y de forma similar $\partial C_{i,j}/\partial M_{i,k}=0$ como $C_{i,j}$ se obtiene tomando un determinante que excluye el $i$ La tercera fila. Por lo tanto, $$\frac{\partial \det(M)}{\partial M_{i,k}}=C_{i,k}.$$

En nuestro caso, la regla de la cadena da $$ \phi_A'(0)=\sum_{i,j=1}^n \frac{\partial \det(A(0))}{\partial A_{i,j}}\frac{\partial A_{i,j}}{\partial x}(0)=\sum_{i=1}^n C_{i,i},$$ donde $C_{i,i}$ es el $(i,i)$ -cofactor de $A(0)=-A$ . Todos los términos no diagonales son cero, ya que $\partial A_{i,j}/\partial x=1$ si $i=j$ y es cero en caso contrario, ya que sólo las entradas diagonales se ven afectadas por la adición de $xI$ . Esto es exactamente $(-1)^{n-1}\text{tr}(\text{adj}(A))$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X