$\def\vect{\mathbf} \DeclareMathOperator{\Mat}{\rm{Mat}} \newcommand{\vol}{{\rm{vol}}} \newcommand\sign{{\rm{sign}}} $
Como dices que aún no has estudiado álgebra lineal, quizá tengas que tomarte esta explicación como un programa de estudio para el futuro (cercano) más que como algo que puedas cursar de una sola vez.
Paso 1. Olvida tus dos definiciones de determinante. El determinante es algo intrínsecamente asociado a las matrices (o a las transformaciones lineales) y está determinado por ciertas propiedades. Consideramos un determinante alternativamente como una función de matrices o como una función de una secuencia de $n$ vectores columna en $\mathbb R^n$ . Vamos de un lado a otro entre $n$ -por- $n$ matrices y secuencias de vectores columna de forma obvia. Las propiedades definitorias:
(1) $\det(v_1, v_2, \dots, v_n)$ es una función multilineal del $n$ variables vectoriales. Es decir, es lineal en cada variable vectorial por separado.
(2) $\det(v_1, v_2, \dots, v_n)$ es alternativo; esto significa que si se cambian dos variables vectoriales cualesquiera, el resultado cambia por un factor de $-1$
(3) Normalización: $\det(E) = 1$ , donde $E$ es la matriz de identidad.
La última propiedad dice que para los vectores unitarios estándar $\vect{e}_1, \dots, \vect{e}_n$ , $\det(\vect{e}_1, \dots, \vect{e}_n) = 1$ .
$\DeclareMathOperator{\Mat}{\rm{Mat}}$
Teorema: Existe una función única $\det$ en $\Mat_n(\mathbb R)$ que satisface las tres propiedades enumeradas anteriormente. Además, \begin {Ecuación} \det (A) = \sum_ { \sigma \in S_n} \epsilon ( \sigma ) a_{1, \sigma (1)} a_{2, \sigma (2) } \cdots a_{n, \sigma (n)}. \tag {S} \end {Ecuación}
En el enunciado del teorema, la suma es sobre el grupo simétrico $S_n$ .
Ahora, utilizando sólo las tres propiedades definitorias, se puede demostrar lo siguiente. Sea $A$ ser un $n$ -por- $n$ y definir $A_{i, j}$ para ser la matriz obtenida al tachar el $i$ --en la fila y $j$ --en la columna de $A$ Así que $A_{i, j}$ es $(n-1)$ -por- $(n-1)$ . Dejemos que $\mathcal C(A)$ sea la matriz cuya $(i, j)$ La entrada es $(-1)^{i+j} \det(A_{i, j})$ . Entonces \begin {Ecuación} A \mathcal C(A)^t = \mathcal C(A)^t A = \det (A) E. \tag {L} \end {ecuación} Esta afirmación engloba todas las expansiones de Laplace de $\det(A)$ y también algunas relaciones de ortogonalidad. Así que no tomes la expansión de Laplace como una definición sino como una consecuencia de la definición intrínseca.
Algunas otras propiedades conocidas de los determinantes que se utilizarán son:
Pueden derivarse utilizando las propiedades definitorias o la fórmula de la suma (S).
Paso 2. Necesitamos una definición operativa de volumen y de volumen firmado. Queremos definir para $1 \le r \le n$ el (no negativo) $r$ volumen dimensional del paralelepípedo abarcado por $r$ vectores $v_1, \dots, v_r$ en $\mathbb R^n$ , denotado como $|\vol_r|(v_1, \dots, v_r)$ . Comenzamos con $|\vol_1|(v_1) = ||v_1||$ . Suponiendo que $r \ge 2$ y que $r-1$ volumen dimensional ha sido definido, hacemos lo siguiente. Si $v_1, \dots, v_r$ son linealmente dependientes, defina $|\vol_r|(v_1, \dots, v_r) = 0$ . En caso contrario, aplicamos el procedimiento Gram-Schmidt a la secuencia de vectores $v_1, \dots, v_r$ para obtener una base ortonormal $\vect f_1, \dots, \vect f_r$ del subespacio $M$ abarcados por $v_1, \dots, v_r$ . Obsérvese que el producto punto $(v_r, \vect f_r)$ es positivo. De hecho, es la longitud de la proyección de $v_r$ en el complemento ortogonal en $M$ de la extensión de $v_1, \dots, v_{r-1}$ (ejercicio). Definir $$ |\vol_r|(v_1, \dots, v_r) = (v_r, \vect f_r) \cdot |\vol_{r-1}|(v_1, \dots, v_{r-1}) . $$ Escribimos $|\vol|$ para $|\vol_n|$ . Este es el procedimiento que conocemos de las matemáticas elementales: tomamos la $(r-1)$ volumen dimensional de la base y multiplicarlo por la altitud unidimensional del paralelepípedo.
No es evidente que el resultado sea independiente del orden en el que los vectores $v_1, \dots, v_r$ están en la lista. Esto surgirá más adelante.
Por último, podemos definir el $n$ volumen dimensional firmado $\vol(v_1, \dots, v_n)$ para una secuencia de $n$ vectores de la siguiente manera. Si los vectores son linealmente dependientes, la respuesta es $0$ . Por lo demás,
toma $$ \vol(v_1, \dots, v_n) = \sign(\det(v_1, \dots, v_n)) |\vol|(v_1, \dots, v_n). $$
Esto está relacionado con una noción de orientación. Una base ordenada de $\mathbb R^n$ se dice que está orientado positivamente si $\det(v_1, \dots, v_n)$ es positivo y orientado negativamente en caso contrario. Así, el volumen con signo es positivo si la base está orientada positivamente y negativa si la base está orientada negativamente. En la dimensión $3$ La orientación puede describirse en términos de la conocida regla de la mano derecha.
Paso 3. Vamos a hablar un poco de las matrices ortogonales. Una matriz $U$ es ortogonal si $U^t U = U U^t = E$ . Esto es así si y sólo si $U$ conserva todos los productos de puntos $(U u, Uv) = (u, v)$ para todos $u, v$ . También si y sólo si las columnas de $U$ forman una base ortonormal de $\mathbb R^n$ . Una matriz ortogonal tiene un determinante igual a $\pm 1$ porque $$\det(U)^2 = \det(U^t) \det (U) = \det(U^t U) = \det(E) = 1.$$
Las matrices ortogonales con determinante 1 se llaman matrices ortogonales especiales.
Observación: Si $U$ es una matriz ortogonal, entonces para cualquier $r \le n$ y cualquier $v_1, \dots, v_r$ , $$ |\vol_r|(Uv_1, \dots, Uv_r) = |\vol_r|(v_1, \dots, v_r). $$ Además, para cualquier $v_1, \dots, v_n$ , $$ \vol(Uv_1, \dots, Uv_n) = \det(U) \vol(v_1, \dots, v_n). $$ En particular, si $U$ es ortogonal especial, entonces $$ \vol(Uv_1, \dots, Uv_n) = \vol(v_1, \dots, v_n). $$
Prueba: se deduce de las definiciones porque las matrices ortogonales conservan los productos interiores, y porque $$\det(U v_1, \dots, U v_n) = \det (U) \det(v_1, \dots, v_n).$$
Paso 4. Tomemos una secuencia de vectores $(b_1, \dots, b_n)$ en posición especial y comparar $\det(b_1, \dots, b_n)$ y $\vol(b_1, \dots, b_n)$ . El supuesto especial es $b_1, \dots, b_{n-1}$ tienen una última coordenada cero, por lo que se encuentran en el intervalo de $\vect e_1, \dots, \vect e_{n-1}$ o, lo que es lo mismo, son perpendiculares a $\vect{e}_n$ . Dejemos que $B = (b_1, \dots, b_n)$ . La última fila de $b$ tiene un valor distinto de cero $(n, n)$ entrada, $b_{n, n} $ y el resto de las entradas son cero. $B$ es, por tanto, triangular en bloque: $$ B = \begin{bmatrix} B_{n, n} & * \\ 0 & b_{n, n} \end{bmatrix}. $$
donde $B_{n,n}$ es $(n-1)$ --por-- $(n-1)$ , $*$ indica un $(n-1)$ --por-- $1$ columna, y $0$ a $1$ --por-- $(n-1)$ fila de ceros.
En esta situación especial,
$$ \det B = \det(b_1, \dots, b_n) = b_{n,n} \det (B_{n,n}), $$ y esta es la expansión de Laplace según la última columna.
Consideremos ahora el cálculo del volumen y del volumen con signo. Tenemos $$ |\vol_{n-1}|(b_1, \dots, b_{n-1}) = |\vol_{n-1}|(B_{n, n}), $$ como se desprende de las definiciones. Dado que el tramo de $b_1, \dots, b_{n-1}$ es el mismo lapso de $\vect e_1, \dots, \vect e_{n-1}$ el vector final de Gram-Schmidt $\vect f_n$ que entra en el cómputo de $|\vol_n|(b_1, \dots, b_n)$ es necesariamente $(\pm 1) \vect e_n$ y $(b_n, \vect f_n)$ es $|b_{n,n}|$ . Así, $$ |\vol_n|(b_1, \dots, b_n) = |b_{n, n}| \, |\vol_{n-1}|(B_{n, n}). $$ Por inducción en la dimensión, podemos suponer $$ \det(B_{n, n}) = \vol_{n-1} (B_{n, n} ) \quad \text{and therefore} \quad |\det(B_{n, n})| = |\vol_{n-1} |(B_{n, n} ). $$ Sustituyendo, $$ |\vol_n|(b_1, \dots, b_n) = |b_{n, n}| \, |\vol_{n-1}|(B_{n, n}) = |b_{n, n}| \, |\det(B_{n, n})| = |\det(B)|. $$ Pero entonces, \begin {align*} \vol (b_1, \dots , b_n) &= \sign ( \det (b_1, \dots b_n)) | \vol_n |(b_1, \dots , b_n) \\ &= \sign ( \det (b_1, \dots b_n)) | \det (b_1, \dots b_n). \\ &= \det (b_1, \dots , b_n). \end {align*}
Paso 5. Reduzcamos el problema general al caso especial que acabamos de considerar. Empecemos con $A = (a_1, \dots, a_n)$ . Tome cualquier matriz ortogonal especial $U$ . Entonces ya sabemos que $$ \det U A = \det(U a_1, \dots, U a_n) = \det U \det A = \det A, $$ y $$ \text{vol}( U A) = \text{vol}(U a_1, \dots, U a_n) = \text{vol}(a_1, \dots, a_n) = \text{vol}(A). $$ Ahora bien, siempre es posible encontrar una matriz ortogonal especial tal que $(U a_1, \dots, U a_{n-1})$ es un sistema de vectores en el plano hiperplano de coordenadas ortogonal a $\vect{e}_n$ y para tal elección, $\text{vol}( U A) = \det (UA)$ por el paso 4. Así, para nuestro original $A = (a_1, \dots, a_n)$ , $$ \text{vol}(A) = \text{vol}(UA) = \det(UA) = \det A. $$
Paso 6. Hasta ahora hemos demostrado que $\text{vol}(A) = \det A$ para cualquier $A = (v_1, \dots, v_n)$ pero no hemos hecho hincapié en las expansiones de Laplace. En particular, querías que las expansiones de Laplace se interpretaran naturalmente como volúmenes con signo. En cierto sentido, no hay nada que demostrar, porque sabemos que el determinante se calcula mediante las expansiones de Laplace y es, por otra parte, igual al volumen. Pero sí obtenemos gratuitamente una interpretación geométrica de la expansión de Laplace. Tomemos una expansión particular, la de la primera columna: $$ \text{vol}(A) = \det(A) = \sum_i a_{i, 1} (-1)^i \det(A_{i, 1}) = (v_1, C), $$ donde $C$ es el vector cuyo $i$ -La coordenada número 1 es $ (-1)^i \det(A_{i, 1})$ . Si mantenemos $v_2, \dots, v_n$ y reemplazar $v_1$ por cualquier vector $w$ en el hiperplano abarcado por $v_2, \dots, v_n$ obtenemos $$ 0 = \det ( w, v_2, \dots, v_n) = (w, C). $$ lo que significa que el vector $C$ es perpendicular al hiperplano que abarca $v_2, \dots, v_n$ . Si mantenemos $v_2, \dots, v_n$ y reemplazar $v_1$ por $C$ obtenemos $$ \det ( C, v_2, \dots, v_n) = (C, C) = ||C||^2 > 0, $$ lo que significa que $(C, v_2, \dots, v_n)$ está orientado positivamente. Ahora bien, si sustituimos $v_1$ por el vector unitario $u = C/||C||$ obtenemos $$ \det ( u, v_2, \dots, v_n) = (u, C) = ||C||. $$ Pero como $u$ es perpendicular al hiperplano que abarca $( v_2, \dots, v_n)$ y de longitud $1$ y $(u, v_2, \dots, v_n)$ está orientado positivamente, tenemos $$ \text{vol}(u, v_2, \dots, v_n) = \text{vol}_{n-1}(v_2, \dots, v_n) $$ el $n-1$ volumen dimensional de $(v_2, \dots, v_n) $ . Por lo tanto, la longitud de $C$ es el $n-1$ volumen dimensional de $(v_2, \dots, v_n) $ .
En resumen, en la expansión de Laplace a lo largo de la primera columna, el vector $C$ que aparece en la expansión $\det (v_1, \dots, v_n) = (v_1, C)$ es perpendicular al hiperplano que abarca $(v_2, \dots, v_n) $ de longitud igual a la $n-1$ volumen dimensional de $(v_2, \dots, v_n) $ y determina un sistema de vectores con orientación positiva $(C, v_2, \dots, v_n)$ y el $n$ volumen dimensional $\text{vol}(v_1, \dots, v_n)$ viene dada por $\text{vol}(v_1, \dots, v_n) = (v_1, C)$ .
1 votos
Relacionado: math.stackexchange.com/questions/427528/
0 votos
Esto definitivamente no es trivial, pero tartarus.org/gareth/maths/Linear_Algebra/determinantes.pdf puede ayudar.
0 votos
@HansLundmark Mi pregunta es por qué el "cálculo" del determinante está relacionado con el volumen y no por qué el determinante está relacionado con el volumen. Yo mismo he podido responder a esta última, pero no a la primera.
0 votos
@PatrickStevens Si estaban definiendo el determinante como D(a,b,c) asumiendo que D(e1,e2,e3)=1 entonces cómo usaron el hecho de que $\det(A)=\sum_{k=1}^n a_{1k}C_{1k}$ . Sé que se puede demostrar porque demuestran que D(a,b,c)= $\sum \pm a_i b_j c_k$ . Pero no quiero verificación, quiero saber si hay algo profundo relacionado $\det(A)$ y $\sum_{k=1}^n a_{1k}C_{1k}$
0 votos
@DevanshSehta: No estoy seguro de entender la diferencia. De todas formas, tu segunda definición no es del todo correcta, ya que el determinante es el firmado volumen (lo que implica que tiene las propiedades habituales de multilinealidad y antisimetría, lo que lleva a la fórmula de "suma sobre todas las permutaciones", que a su vez implica las fórmulas de expansión del cofactor).