50 votos

Encontrar la base de un espacio nulo

Estoy tratando de entender por qué el método utilizado en mi libro de texto de álgebra lineal para encontrar la base del espacio nulo funciona. El libro de texto es 'Álgebra lineal elemental' de Anton.

Según el libro de texto, la base del espacio nulo para la siguiente matriz:

$A=\left(\begin{array}{rrrrrr} 1 & 3 & -2 & 0 & 2 & 0 \\ 2 & 6 & -5 & -2 & 4 & -3 \\ 0 & 0 & 5 & 10 & 0 & 15 \\ 2 & 6 & 0 & 8 & 4 & 18 \end{array}\right) $

se encuentra encontrando primero la forma escalonada reducida, lo que lleva a lo siguiente:

$(x_1,x_2,x_3,x_4,x_5,x_6)=(-3r-4s-2t,r,-2s,s,t,0)$

o, alternativamente, como

$(x_1,x_2,x_3,x_4,x_5,x_6)=r(-3,1,0,0,0,0)+s(-4,0,-2,1,0,0)+t(-2,0,0,0,1,0)$

Esto demuestra que los vectores

${\bf v_1}=(-3,1,0,0,0,0),\hspace{0.5in} {\bf v_2}=(-4,0,-2,1,0,0),\hspace{0.5in} {\bf v_3}=(-2,0,0,0,1,0)$

abarcan el espacio de la solución.

Se puede demostrar que para un sistema lineal homogéneo, este método siempre produce una base para el espacio de soluciones del sistema.

Pregunta

  1. No entiendo por qué este método siempre producirá una base de $Ax=0$ . ¿Podría alguien explicarme por qué este método funciona siempre? Si ayuda a explicar, ya entiendo el proceso de encontrar la base de un espacio de columnas y de un espacio de filas. También entiendo por qué las operaciones elementales de fila no alteran el espacio nulo de una matriz.

  2. ¿Qué propiedades específicas de las matrices o del espacio vectorial debo conocer para entender por qué funciona este método?

55voto

Joe Lencioni Puntos 4642

El espacio nulo de $A$ es el conjunto de soluciones de $A{\bf x}={\bf 0}$ . Para encontrarlo, se puede tomar la matriz aumentada $[A|0]$ y la fila se reduce a una forma escalonada. Tenga en cuenta que cada entrada en la columna más a la derecha de esta matriz siempre será 0 en los pasos de reducción de fila. Por lo tanto, también podemos reducir en fila $A$ y a la hora de encontrar soluciones a $A{\bf x}={\bf 0}$ Sólo hay que tener en cuenta que la columna que falta son todos 0's.

Supongamos que después de hacer esto, se obtiene $$ \left[\matrix{1&0&0&0&-1 \cr 0&0&1&1&0 \cr 0&0&0&0&0 \cr 0&0&0&0&0 \cr }\right] $$

Ahora, mire las columnas que no contienen ninguna de las entradas de la fila principal. Estas columnas corresponden a las variables libres de la solución fijada en $A{\bf x}={\bf 0}$ Nótese que en este punto, sabemos que la dimensión del espacio nulo es 3, ya que hay tres variables libres. Que el espacio nulo tiene dimensión 3 (y por lo tanto el conjunto de soluciones a $A{\bf x}={\bf 0}$ tiene tres variables libres) también se podría haber obtenido sabiendo que la dimensión del espacio de columnas es 2 a partir del teorema de nulidad de rango.

Las "columnas libres" en cuestión son 2,4 y 5. Podemos asignar cualquier valor a su variable correspondiente.

Por lo tanto, fijamos $x_2=a$ , $x_4=b$ y $x_5=c$ , donde $a$ , $b$ y $c$ son arbitrarios.

Ahora resuelve para $x_1$ y $x_3$ :

La segunda fila nos dice $x_3=-x_4=-b$ y la primera fila nos dice $x_1=x_5=c$ .

Por lo tanto, la solución general de $A{\bf x}={\bf 0}$ es $$ {\bf x}=\left[\matrix{c\cr a\cr -b\cr b\cr c}\right] $$

Hagamos una pausa por un segundo. Lo sabemos:

1) El espacio nulo de $A$ consiste en todos los vectores de la forma $\bf x $ arriba.

2) La dimensión del espacio nulo es 3.

3) Necesitamos tres vectores independientes para nuestra base del espacio nulo.

Así que lo que podemos hacer es tomar $\bf x$ y dividirlo de la siguiente manera:

$$\eqalign{ {\bf x}=\left[\matrix{c\cr a\cr -b\cr b\cr c}\right] &=\left[ \matrix{0\cr a\cr 0\cr 0\cr 0}\right]+ \left[\matrix{c\cr 0\cr 0\cr 0\cr c}\right]+ \left[\matrix{0\cr 0\cr -b\cr b\cr 0}\right]\cr &= a\left[ \matrix{0\cr1\cr0\cr 0\cr 0}\right]+ c\left[ \matrix{1\cr 0\cr 0\cr 0\cr 1}\right]+ b\left[ \matrix{0\cr 0\cr -1\cr 1\cr 0}\right]\cr } $$ Cada uno de los vectores columna anteriores está en el espacio nulo de $A$ . Además, son independientes. Por lo tanto, forman una base.

No estoy seguro de que esto responda a su pregunta. He hecho un poco de "mano" aquí. Lo que he pasado por alto son los hechos:

1)Las columnas de la forma escalonada de $A$ que no contengan entradas de fila principales corresponden a las "variables libres" para $A{\bf x}={\bf 0}$ . Si el número de estas columnas es $r$ entonces la dimensión del espacio nulo es $r$ (de nuevo, si se conoce la dimensión del espacio de columnas, se puede ver que la dimensión del espacio nulo debe ser el número de estas columnas a partir del teorema de la nulidad).

2) Si se divide la solución general en $A{\bf x}={\bf 0}$ como se ha hecho anteriormente, entonces estos vectores serán independientes (y abarcan, por supuesto, ya que tendrá $r$ de ellos).

0 votos

:Gracias por explicar el procedimiento de encontrar la base del espacio nulo. Me parece mucho más claro que como lo explicaba el libro de texto. Sin embargo, sigo sin tener claro por qué al dividir la solución general se obtiene un conjunto de vectores que abarcan el espacio nulo. Además, el conjunto de vectores son independientes porque la división $\bf x$ siempre producirá vectores distintos de cero, por lo que $a_1{\bf v_1}+a_2{\bf v_2}+...+a_n{\bf v_n}$ sólo tendrá la solución trivial. ¿Es esto correcto?

1 votos

@sara Perdón por el último comentario. Cuando te separas $\bf x$ arriba, lo divides en vectores con soportes disjuntos, por lo que tendrás independencia. Para el spanning: Al dividir la solución general como se ha indicado anteriormente, se obtiene el número necesario de vectores para una base del espacio nulo, ya que se descompone $x$ en una combinación lineal de tantos vectores como variables libres tenga (y el número de variables libres es el número de "columnas libres", que a su vez es la dimensión del espacio nulo por el teorema de la nulidad).

0 votos

Muchas gracias por su aclaración

11voto

Antoni Parellada Puntos 276

Hay una parte mecánica en la respuesta aceptada (+1) que posiblemente necesite una explicación más detallada, a saber, el proceso detrás de

lo que podemos hacer es tomar $\mathbf x$ y dividirlo

Reducción de la matriz $A$ a la forma escalonada reducida (rref) resulta:

$$A=\left(\begin{array}{rrrrrr} 1 & 3 & -2 & 0 & 2 & 0 \\ 2 & 6 & -5 & -2 & 4 & -3 \\ 0 & 0 & 5 & 10 & 0 & 15 \\ 2 & 6 & 0 & 8 & 4 & 18 \end{array}\right)\to\left(\begin{array}{rrrrrr} \bbox[5px,border:2px solid red]1 & 3 & 0 & 4 & 2 & 0 \\ 0 & 0 & \bbox[5px,border:2px solid red]1 & 2 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & \bbox[5px,border:2px solid red]1 \\ 0 & 0 & 0 & 0 & 0 & 0 \end{array}\right)$$

Hay tres columnas pivotantes que corresponden al pivote $1$ en rojo, y el teorema de nulidad de rango nos dice que hay $n-r=3$ vectores en cualquier base de la $N(A)$ correspondiente a las variables libres.

En este punto conviene recordar de dónde viene todo esto: el sistema homogéneo de ecuaciones lineales $A\vec x = \vec 0,$ que ahora se ha reducido a:

$$\begin{align} 1x_1 + 3x_2+ 0x_3+4x_4+2x_5 +0x_6 &=0\\ 0x_1 + 0x_2+ 1x_3+2x_4+0x_5 +0x_6 &=0\\ 0x_1 + 0x_2+ 0x_3+0x_4+0x_5 +1x_6 &=0\\ 0x_1 + 0x_2+ 0x_3+0x_4+0x_5 +0x_6 &=0\\ \end{align}$$

Expresar las variables pivote en términos de las variables libres:

$$\begin{align} 1x_1 &= - 3\;\color{blue}{x_2} - 4\;\color{red}{x_4} - 2\;\color{magenta}{x_5} \\ 1x_3 &= -2\;\color{red}{x_4}\\ 1x_6 &=\;0\\ \end{align}$$

muestra inmediatamente la forma en que los vectores base del $N(A)$ se rellenarán a partir de su forma "esqueleto" indicando simplemente la columna donde se encuentra la variable libre en cuestión (es decir $x_2,x_4,x_5$ ):

$$\left\{\begin{bmatrix}0\\\color{blue}1\\0\\0\\0\\0\end{bmatrix},\begin{bmatrix}0\\0\\0\\\color{red}1\\0\\0\end{bmatrix},\begin{bmatrix}0\\0\\0\\0\\\color{magenta}1\\0\end{bmatrix}\right\}\to \color{blue}{x_2}\,\begin{bmatrix}0\\1\\0\\0\\0\\0\end{bmatrix}+\color{red}{x_4}\,\begin{bmatrix}0\\0\\0\\1\\0\\0\end{bmatrix}+\color{magenta}{x_5}\,\begin{bmatrix}0\\0\\0\\0\\1\\0\end{bmatrix}$$

a la forma final:

$$\color{blue}{x_2}\,\begin{bmatrix}-3\\1\\0\\0\\0\\0\end{bmatrix}+\color{red}{x_4}\,\begin{bmatrix}-4\\0\\-2\\1\\0\\0\end{bmatrix}+\color{magenta}{x_5}\,\begin{bmatrix}-2\\0\\0\\0\\1\\0\end{bmatrix}\to \text{basis }N(A)= \left\{\begin{bmatrix}-3\\\color{blue}1\\0\\0\\0\\0\end{bmatrix},\begin{bmatrix}-4\\0\\-2\\\color{red}1\\0\\0\end{bmatrix},\begin{bmatrix}-2\\0\\0\\0\\\color{magenta}1\\0\end{bmatrix}\right\}$$

Así que se reduce a cambiar los signos de las entradas en el rref, y a mantener el control de las variables libres.


require("pracma")
A = matrix(c(1,3,-2,0,2,0,2,6,-5,-2,4,-3,0,0,5,10,0,15,2,6,0,8,4,18), nrow=4, byrow=T)
x2= c(-3,1,0,0,0,0); A %*% x2; x4=c(-4,0,-2,1,0,0); A %*% x4; x5=c(-2,0,0,0,1,0); A %*% x5

1voto

dantopa Puntos 111

Solución

La matriz $\mathbb{C}^{m\times n}_{\rho}$ es mapa entre $\mathbb{C}^{n}$ y $\mathbb{C}^{m}$ .

Consideremos los vectores $x\in\mathbb{C}^{n}$ , $y\in\mathbb{C}^{m}$ . La matriz $\mathbf{A}$ mapas $\mathbb{C}^{n}$ a $\mathbb{C}^{m}$ ; $\mathbf{A}^{*}$ mapas $\mathbb{C}^{m}$ a $\mathbb{C}^{n}$ .

El Teorema Fundamental del Álgebra Lineal aparece en forma de mapa.

$$ % \begin{align} % \mathbf{A} x = y \qquad \mathbb{C}^{n} &\mapsto \mathbb{C}^{m} \\ % \mathbf{A}^{*} y = x \qquad \mathbb{C}^{m} &\mapsto \mathbb{C}^{n} \\ % \end{align} % $$


Ya entiendo el proceso de encontrar la base de un espacio de columna y de un espacio de fila

Como las maquinaciones son claras, elegimos una matriz más sencilla que atiende a la manipulación mental: $$ \mathbf{A} = \left[ \begin{array}{ccr} 1 & 3 & -2 \\ 2 & 6 & -5 \\ \end{array} \right] \in \mathbb{C}^{3\times 2}_{2} $$

El único espacio nulo no trivial es $\mathcal{N}\left( \mathbf{A} \right)$ .

La matriz aumentada es $$ % \left[ \begin{array}{c|c} \mathbf{A}^{*} & \mathbf{I}_{3} \\ \end{array} \right] % = % \left[ \begin{array}{rr|ccc} 1 & 2 & 1 & 0 & 0 \\ 3 & 6 & 0 & 1 & 0 \\ -2 & -5 & 0 & 0 & 1 \\ \end{array} \right] $$ Se realiza una secuencia de operaciones elementales de fila para reducir el componente de la izquierda a la forma escalonada de fila. Llama a la primera operación que borra la primera columna $\mathbf{E}_{1}.$

$$ \mathbf{E}_{1} \left[ \begin{array}{c|c} \mathbf{A}^{*} & \mathbf{I}_{3} \\ \end{array} \right] = \left[ \begin{array}{c|c} \mathbf{E}_{1} \mathbf{A}^{*} & \mathbf{E}_{1} \mathbf{I}_{3} \\ \end{array} \right] $$ El segundo paso borra la segunda columna: $$ \mathbf{E}_{2} \left[ \begin{array}{c|c} \mathbf{E}_{1} \mathbf{A}^{*} & \mathbf{E}_{1} \mathbf{I}_{3} \\ \end{array} \right] = \left[ \begin{array}{c|c} \mathbf{E}_{2} \mathbf{E}_{1} \mathbf{A}^{*} & \mathbf{E}_{2} \mathbf{E}_{1} \mathbf{I}_{3} \\ \end{array} \right] = \left[ \begin{array}{cr|rcc} 1 & 2 & 1 & 0 & 0 \\ 0 & 0 & \color{red}{-3} & \color{red}{1} & \color{red}{0} \\ 0 & -1 & 2 & 0 & 1 \\ \end{array} \right] $$

Tu pregunta es cómo apareció el vector espacial nulo: $$ % \left[ \begin{array}{ccr} 1 & 3 & -2 \\ 2 & 6 & -5 \\ \end{array} \right] % \left[ \begin{array}{r} \color{red}{-3} \\ \color{red}{1} \\ \color{red}{0} \end{array} \right] % = % \left[ \begin{array}{r} 0 \\ 0 \end{array} \right] % $$


La respuesta implica un cambio de perspectiva.

Las operaciones elementales se esculpen para barrer la matriz y limpiar las filas sucesivas. Esto está claro. El cambio de perspectiva implica ver la matriz aumentada como una colección de vectores de fila: $$ % \left[ \begin{array}{c|c} \mathbf{A}^{*} & \mathbf{I}_{3} \\ \end{array} \right] % = % \left[ \begin{array}{c|c} u^{*}_{1} & v^{*}_{1} \\ u^{*}_{2} & v^{*}_{2} \\ u^{*}_{3} & v^{*}_{3} \\ \end{array} \right] % $$

Por construcción, el $u$ vectores en $\mathbf{C}^{3}$ están vinculadas al $v$ vectores en $\mathbf{C}^{2}$ a través de $$ \boxed{ v^{*}_{k} \mathbf{A}^{*} = u^{*}_{k}, \quad k = 1, 2, 3 } $$ La forma final que buscamos viene dada por $$ \begin{align} % \left( v^{*}_{k} \mathbf{A}^{*} \right)^{*} &= \left( u^{*}_{k} \right)^{*} \\ % \mathbf{A} v_{k} &= u_{k} % \end{align} $$ La acción de mapeo de la matriz $\mathbf{A}$ define la matriz aumentada. Cuando la manipulación crea una $u=\mathbf{0}$ vector, el correspondiente $v$ vector debe estar en el espacio nulo.


Matemáticas coloquiales

La matriz aumentada es una herramienta para estudiar la acción de mapeo de una matriz entre los espacios vectoriales $\mathbf{C}^{m}$ y $\mathbf{C}^{n}$ . Para encontrar vectores del espacio nulo, manipule el lado izquierdo para crear una fila cero. Un vector de espacio nulo aparece como un vector de fila en el lado derecho.

-3voto

masterxilo Puntos 123

El software Mathematica puede encontrar un conjunto de espacio nulo para matrices dadas con coeficientes exactos. Puede encontrar exactamente la respuesta que da tu libro:

NullSpace[{{1, 3, -2, 0, 2, 0}, {2, 6, -5, -2, 4, -3}, {0, 0, 5, 10, 0, 15}, {2, 6, 0, 8, 4, 18}}]

da

{{-2, 0, 0, 0, 1, 0}, {-4, 0, -2, 1, 0, 0}, {-3, 1, 0, 0, 0, 0}}

Le sugiero que empezar aquí si está interesado en saber cómo se hace esto de una manera computacionalmente eficiente y, por supuesto, demostrablemente correcta. Esa sección de Wikipedia, por ejemplo, señala que en la práctica el llamado algoritmo de Bareiss es más útil que la eliminación gaussiana.

0 votos

(Mis disculpas: esta es una pregunta diferente. Sin embargo, mi queja original sigue en pie: este post no tenía que ser llevado a la página principal después de casi 5 años).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X