Defino $\phi_A(x)=\det(A-\lambda I)$ . El coeficiente se obtiene en $\lambda^{n-k}$ de la siguiente manera: elige $k$ entradas diagonales $a_{i_1i_1},...,a_{i_ki_k}$ . Estos definen un $k\times k$ menor de $A$ que se obtiene eliminando todas las filas y columnas que no contienen uno de los elementos diagonales elegidos. Calcula el determinante de este menor y suma sobre todos los $n\choose k$ selecciones de la $k$ entradas diagonales. Hasta el signo (que es sólo la alternancia) que es su $\lambda^{n-k}$ coeficiente.
Tengo que decir que no conozco una prueba formal precisa (EDIT: ir al final de la respuesta, ahora he añadido un intento de formalizar lo que sigue), me gusta ver esto de una manera más algorítmica. Así es como me convenzo: $$ \begin{vmatrix} a_{11}-\lambda & a_{12} & ... & a_{1n} \\ a_{21} & a_{22}-\lambda & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ...& a_{nn}-\lambda \end{vmatrix}=\\ =\begin{vmatrix} a_{11} & a_{12} & ... & a_{1n} \\ a_{21} & a_{22}-\lambda & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ...& a_{nn}-\lambda \end{vmatrix}-\lambda\begin{vmatrix} a_{22}-\lambda & ... & a_{2n} \\ ... & ... & ... \\ a_{n2} & ...& a_{nn}-\lambda \end{vmatrix} $$ Ahora ves que el problema se ha dividido en dos partes. Trata cada una por separado: en la primera, pasa a la siguiente columna y vuelve a dividir el determinante como $$ \begin{vmatrix} a_{11} & a_{12} & ... & a_{1n} \\ a_{21} & a_{22}-\lambda & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ...& a_{nn}-\lambda \end{vmatrix}=\begin{vmatrix} a_{11} & a_{12} & ... & a_{1n} \\ a_{21} & a_{22} & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ...& a_{nn}-\lambda \end{vmatrix}-\lambda\begin{vmatrix} a_{11} & ... & a_{2n} \\ ... & ... & ... \\ a_{n2} & ...& a_{nn}-\lambda \end{vmatrix} $$ Haz lo mismo con el segundo. Si sigues haciendo esto, aparecerá un gran número de determinantes ( $2^n$ en total - que no es más que la suma de los coeficientes binomiales $n\choose k$ , ya sugestivo). Se puede ver esto como un árbol de decisión: en cada paso, se dice si se quiere mantener el $i$ -a la columna o no. Después de elegir, no volverás a tocar las columnas anteriores. Por lo tanto, si haces esto, obtendrás determinantes cuadrados a los que les faltan algunas columnas. Si eliges algunas columnas (equivalentemente, algunos elementos diagonales) para eliminar, di "NO" a cada decisión en la que elimines una de las columnas deseadas y "SÍ" en caso contrario. Esto define un camino en el árbol binario que termina cuando no hay más $\lambda$ se quedan. Dado que cada selección de $k$ elementos diagonales corresponde exactamente a un camino en el árbol binario con $n-k$ "SÍ", obtendrá $(-1)^{n-k}\lambda^{n-k}$ delante de cada uno de esos determinantes y, por tanto, al sumarlos todos, se obtiene precisamente la suma de todos los centrados en la diagonal $k\times k$ determinantes.
En particular, se obtiene el término lineal eliminando sólo $1$ columna y fila y sumando sobre todas las posibilidades. Como se trata de determinantes de los menores principales que figuran en la definición de la matriz adjunta, lo que se calcula es simplemente la suma de los elementos diagonales de la adjunta, es decir, su traza.
Si no se cree toda esta palabrería (que es perfectamente razonable), le recomiendo encarecidamente que pruebe un $4\times 4$ caso ya que eso es sólo $16$ determinantes en total, o, si tiene mucho papel, el $5\times 5$ caso. Eso podría ayudarte a tener una "sensación" del patrón.
También creo que este mismo argumento se podría hacer más riguroso si se lanzaran algunos argumentos como "en el $i$ -ésima etapa, los determinantes de un determinado tamaño aparecerán a una determinada potencia de $\lambda$ " y tratar de hacer esto por inducción, pero nunca llegué a hacerlo así que es sólo una corazonada en este punto.
Así que intenté formalizar esto un poco y aquí está mi intento. Dejemos que $D(b_1,b_2,...,b_n)$ denotan los distintos determinantes que aparecerán, donde $b_i\in\{0,1,2\}$ . $b_i=0$ significa que se elimina el $i$ -en la fila y en la columna por completo, $b_i=1$ significa que sólo se elimina el $\lambda$ en $a_{ii}$ y $b_i=2$ significa "dejar el $i$ -ésimo elemento diagonal y su fila y columna tal cual". Por ejemplo: $$ D(2,2,2)=\begin{vmatrix} a_{11}-\lambda & a_{12} & a_{13} \\ a_{21} & a_{22}-\lambda & a_{23} \\ a_{31} & a_{32} & a_{33}-\lambda \end{vmatrix}\quad D(2,1,1)=\begin{vmatrix} a_{11}-\lambda & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{vmatrix}\\ D(2,1,0)=\begin{vmatrix} a_{11}-\lambda & a_{12}\\ a_{21} & a_{22} \end{vmatrix} $$ Tenemos la fórmula de reducción: $$D(b_1,...,2,...,b_n)=D(b_1,...,1,...,b_n)-\lambda D(b_1,...,0,...,b_n)$$ Comenzamos con $D(2_1,2_2,...,2_n)$ . Escriba $\bf{b}$ para el vector de $b_i$ y que $\Vert {\bf b}\Vert$ sea el número de $1$ 's en $\bf{b}$ . Si procedemos por inducción, podemos decir que $$D(0,2_1,...,2_{n-1})=\sum_{\dim{\bf b}=n-1\\\quad \,2\not\in{\bf b}}D(0,{\bf b})(-\lambda)^{n-1-\Vert{\bf b}\Vert}$$ Desde el $0$ en la parte delantera no juega ningún papel y la fórmula de reducción es la misma independientemente de lo que el primer $b_i$ es, debemos tener eso también: $$D(1,2_1,...,2_{n-1})=\sum_{\dim{\bf b}=n-1\\\quad \,2\not\in{\bf b}}D(1,{\bf b})(-\lambda)^{n-1-\Vert{\bf b}\Vert}$$ Esto se puede demostrar rigurosamente observando que si aplicamos la fórmula de reducción a $D(0,{\bf b})$ en algún índice, obtenemos lo mismo que si lo hiciéramos para $D(1\text{ or }2,{\bf b})$ pero para el primer índice. Aplicando la reducción inductiva sobre los índices, eliminamos todos los $2$ pero como en cada paso la fórmula es la misma salvo que cambiamos el primer índice, al final nos quedamos con fórmulas idénticas pero para el primer índice.
De todos modos, tenemos: $$ D(2_1,2_2,...,2_n)=D(1,2,...,2)-\lambda D(0,2,...,2)=\\ =\sum_{\dim{\bf b}=n-1\\\quad \,2\not\in{\bf b}}\left(D(1,{\bf b})(-\lambda)^{n-1-\Vert{\bf b}\Vert}+D(0,{\bf b})(-\lambda)^{n-\Vert{\bf b}\Vert}\right)=\sum_{\dim{\bf b}=n\\\,\,\,\,\, 2\not\in{\bf b}}D({\bf b})(-\lambda)^{n-\Vert{\bf b}\Vert} $$ Esto establece el paso inductivo y completa la prueba.
Debido a la útil sugerencia de @amd en los comentarios, he aquí una aproximación con la fórmula de Leibniz. Aquí, $N=\{1,...,n\}$ . \begin{align} &\det(A-\lambda I)=\sum_{\sigma\in\mathrm{Sym}(n)}\mathrm{sgn}(\sigma)\prod_{i=1}^n(a_{i\sigma(i)}-\lambda\delta_{i\sigma(i)})=\\ &=\sum_{\sigma\in\mathrm{Sym}(n)}\mathrm{sgn}(\sigma)\sum_{A\subset N}\prod_{i\in A}a_{i\sigma(i)}\prod_{j\in N-A}(-\lambda)\delta_{j\sigma(j)}=\\ &=\sum_{A\subset N}(-\lambda)^{n-\Vert A\Vert}\sum_{\sigma\in\mathrm{Sym}(n)}\mathrm{sgn}(\sigma)\prod_{i\in A}a_{i\sigma(i)}\prod_{j\in N-A}\delta_{j\sigma(j)} \end{align} En la última expresión tenemos que $\prod_{j\in N-A}\delta_{j\sigma(j)}$ que es $0$ a menos que $N-A$ contiene sólo puntos fijos de $\sigma$ - En otras palabras, sólo tenemos que sumar sobre $\sigma$ cuyos puntos fijos son un superconjunto de $N-A$ . Pero estas nuevas permutaciones forman un grupo que es esencialmente $\mathrm{Sym}(A)$ las permutaciones de $A$ . El signo de una permutación de longitud $m$ es $(-1)^k$ donde $k=m-\text{(number of disjoint cycles that make up $ \N - El sigma $)}$ - cuando dejamos los puntos estacionarios de $\sigma$ , $m$ disminuye, pero el número de ciclos disjuntos disminuye exactamente en la misma cantidad, ya que los puntos estacionarios corresponden a ciclos triviales. Por lo tanto, el signo sigue siendo el mismo y tenemos: $$ \det(A-\lambda I)=\sum_{A\subset N}(-\lambda)^{n-\Vert A\Vert}\sum_{\sigma\in\mathrm{Sym}(A)}\mathrm{sgn}(\sigma)\prod_{i\in A}a_{i\sigma(i)} $$ Pero las sumas sobre $\sigma\in\mathrm{Sym}(A)$ son ahora sólo determinantes de los principales menores y hemos terminado.
2 votos
La expansión de Leibniz parece casi hecha para demostrar esto.