51 votos

Por qué el álgebra lineal es divertida (o ?)

Editar: el cartel original es Menny pero la pregunta es CW; el pronombre en primera persona se refiere a Menny, no al editor más reciente.


Estoy dando una charla introductoria al álgebra lineal con el siguiente objetivo: quiero dar a los alumnos un ejemplo concreto a través del cual puedan ver cómo muchas nociones surgen de forma "natural". Nociones como espacios vectoriales, el vector cero, span, dependencia e independencia lineal, base, dimensión, bases "buenas", resolución de ecuaciones lineales, e incluso mapas lineales y vectores propios. Una cuestión de MO relacionada es Pruebas de álgebra lineal en combinatoria .

El objetivo de este post es encontrar algunos ejemplos más "concretos", "reales" y "naturales" en este espíritu que puedan interesar a todos los que aman lo que hacemos (y darles motivación para aprender nuevas definiciones y formalismos). Así que si tienes algunas ideas, ¡por favor, publícalas! Gracias, Menny

53voto

Eric Puntos 246

Un ejemplo que me encantó en mi última clase fue la compresión de imágenes con pérdidas mediante la descomposición de valores singulares.

La SVD dice que la transformación correspondiente a cualquier matriz real (no necesariamente cuadrada) puede descomponerse en tres pasos: una rotación que olvida algunas dimensiones, un estiramiento a lo largo de los ejes de coordenadas y, finalmente, una rotación. En otras palabras, toda matriz puede escribirse de la forma HDA, siendo las filas de A ortonormales, las columnas de H ortonormales y D una matriz diagonal cuadrada con entradas no negativas no crecientes en la diagonal.

Considere una fotografía que es un $768\times 1024$ conjunto de $(red,green,blue)$ triples, que también podemos almacenar como 3 matrices $R$ , $G$ y $B$ de números reales. Ahora bien, aunque la matriz $R$ no tiene nada que ver con la transformación del espacio, podemos considerarlo como tal, y utilizando la SVD escribir $R=HDA$ . Llama a los números de la diagonal de $D$ por $\lambda_1\geq \lambda_2 \geq \cdots \geq \lambda_s\geq 0$ y que $D_k'$ sea $diag(\lambda_1,\dots,\lambda_k,0,0,\dots)$ , un $s\times s$ matriz diagonal, y dejemos que $D_k$ sea $diag(\lambda_1,\dots,\lambda_k)$ . Sea $H_k$ sea el $768\times k$ matriz formada a partir de la primera $k$ columnas de $H$ y, del mismo modo, dejemos que $A_k$ sea el $k\times 1024$ matriz formada a partir de la primera $k$ filas de $A$ . Entonces $$R = HDA \approx HD_k' A = H_k D_k A_k,$$ donde $\approx$ es debido a la continuidad, lo que es apropiado si el $\lambda$ que fueron sustituidos por ceros eran pequeños.

Ahora, el remate. Necesitamos $3\cdot 768 \cdot 1024$ (unos 2 megabytes) reales inicialmente para almacenar la fotografía. Pero para almacenar $H_k$ , $D_k$ y $A_k$ para cada uno de los tres colores, sólo necesitamos $3(768\cdot k+k+k\cdot 1024)=5379 k$ números reales. Con $k=25$ , lo que da una relación de compresión de aproximadamente 18. Es decir, el tamaño del archivo pasa de unos 2 mb a unos 130 kb. Es decir, es más rápido por un factor de 20 transmitir las tres matrices $H_{25}, D_{25}, A_{25}$ que transmitir su producto.

La SVD es lo suficientemente rápida de calcular como para que puedas hacer esto al instante (usando Mathematica, por ejemplo) con una imagen del público, y ellos puedan maravillarse con sus propias caras borrosas (pero bastante reconocibles). Además, mostrar el tamaño real de los archivos en disco del mapa de bits original y de la imagen comprimida es bastante impresionante. Al menos, lo es si tus cálculos se aproximan mucho.

Lo realmente impresionante de este ejemplo (para mí, al menos) es que la matriz con la que empezamos es sólo una tabla de datos y no una transformación. Pero al considerarla como si fuera una transformación, ganamos poder sobre ella de todos modos. Esto es una gran motivación para el álgebra lineal; a los estudiantes les resulta mucho más fácil imaginar que se encuentran con una tabla de datos que con una transformación lineal.

46voto

Greg R. Puntos 499

Mi aplicación elemental favorita del álgebra lineal es demostrar que la descomposición utilizada en el Cálculo de funciones racionales en fracciones parciales funciona.

Comienza con un polinomio $Q(x)=(x-r_1)(x-r_2)\cdots(x-r_n)$ . Entonces el espacio de $P(x)/Q(x)$ con $deg P < deg Q$ es $n$ -ya que tiene una base { $\frac{1}{Q(x)}, \frac{x}{Q(x)}, \frac{x^2}{Q(x)}, \dots, \frac{x^{n-1}}{Q(x)}$ }. Pero { $\frac{1}{(x-r_1)},\frac{1}{(x-r_2)},\dots,\frac{1}{(x-r_n)}$ } son vectores linealmente independientes en el espacio y, por tanto, forman una base.

Por lo tanto, $\frac{P(x)}{Q(x)}=\frac{A_1}{(x-r_1)}+\frac{A_2}{(x-r_2)}+\dots+\frac{A_n}{(x-r_n)}$ para algunas constantes { $A_1,\dots,A_n$ }, que además podemos encontrar tomando el límite de $(x-r_i)\frac{P(x)}{Q(x)}$ como $x$ va a $r_i$ .

30voto

Jon Galloway Puntos 320

Menny La versión original de la pregunta anterior incluía el siguiente ejemplo, que está mejor colocado en una respuesta, para que pueda ser votado arriba y abajo. Como todas las respuestas a cualquier pregunta de CW, ésta es wiki de la comunidad. El resto de este post, a menos que alguien lo edite, consiste en la escritura de Menny, por lo que el pronombre en primera persona es Menny, no Theo.


Mi ejemplo: la secuencia de Fibonacci. Lo escribiré en la forma en que pretendo presentarlo; espero que no te aburra y te dé una idea del tipo de ejemplo que busco.

  • empezar por definirlo. Que se pregunten cuál es el término general.
  • Definir $F_{a,b}$ para ser la Secuencia de Fibonacci que comienza con (a,b,a+b,...). Haz hincapié en que conozcan los dos primeros, determina los demás términos (¡pero no explícitamente! (todavía)
  • Pregúntales si existe una secuencia que "realmente conozcan", es decir, que me puedan dar el término general. (a alguien se le ocurrirá la secuencia cero (¡vector cero!)).

    • Diles: si te doy el término general de, digamos $F_{2,3}$ puede utilizar esta información para encontrar los términos generales de otras secuencias? (con suerte, descubriremos que podemos multiplicar por escalares)

    • destaca este gran descubrimiento - ¡un múltiplo escalar de Fib seq es otro Fib seq!

    • Bueno, supongamos que se les da $F_{2,3}$ explícitamente, ¿pueden llegar a cualquier otra seq. por múltiplos escalares?

    • ¿No? Bien, entonces te daré otra secuencia, ¿cuál quieres? (dependencia lineal...)

    • ¡¡¡Llegar al hecho de que también se puede añadir!!!

    • Tome $F_{2,4}$ ¿Es esto suficiente? Sí. Bueno, ¿cómo se llega a $F_{0,1}$ ? y a $F_{\sqrt{2},1.5}$ (¡¡¡Resolución de ecuaciones lineales!!!)

    • Bueno, estos $F_{2,4}$ , $F_{2,3}$ ¡¡¡¡¡debe por especial, si nos esforzamos y encontramos sus términos generales, encontraríamos cualquier término general de cualquier Fib. seq!!!!!

    • ¿Cuáles son sus principales propiedades? No se puede llegar a uno desde el otro, con ambos se puede llegar a todos (¡esto es casi la definición de una base...!)

    • ¿Podemos encontrar tres seq. como la última también con propiedades similares? ¿Cómo formularíamos la propiedad "no se puede llegar a una desde la otra" para 3 seq.

    • Bueno, que muestren \give como ejercicio\Ndemuestre usted mismo que esto no puede ser.

    • Pregunta: ¿algunas dos seq con la propiedad de que no se puede llegar a una desde la otra, también tienen la propiedad de que se puede llegar a todo con ellas (usando multi. escalar y suma)?

    • Pregunta: ¿la pregunta inversa?

    • Resumir: Hemos visto un espacio vectorial, el hecho de que un vector no puede abarcar un espacio de 2 dimensiones, el hecho de que los 3 son linealmente dependientes, el hecho de que 2 lin.indep. abarcan y viceversa.... y (no he escrito) que el vector cero no ayuda a abarcar y siempre se puede llegar a él.

    • PERO..... ¡esto se está volviendo aburrido! aún no hemos encontrado ningún término general y estamos asumiendo que lo hicimos. PERO podemos redefinir un objetivo muy glorioso: ¡encontrar dos secuencias linealmente dependientes con su término general!

    • Sólo "conocemos" dos secuencias de la escuela secundaria: probemos las progresiones aritméticas. Bueno... no funciona.

    • ¡Probemos la secuencia geométrica! ...lo resuelve... ¡Funciona! con q que satisface q^2=q+1. ¡Por fin, una motivación "real" para resolver una ecuación cuadrática!

    • encontrar una "base"

    • dar la fórmula de $F_{0,1}$ ¡!

    • Resumir - esta vez dividiendo la tabla en "parte formal" que tendrá palabras como espacio vectorial, etc. y una parte con seq y "mala definición" como la anterior.

Si también quiere hablar de los vectores propios y dar una razón más "natural" para utilizar la sucesión geométrica, dígales que hay otra "simetría"/operación para la sucesión: el mapa de desplazamiento. - Bien, una secuencia es geométrica si y sólo si es un vector propio. Además, puedes hablar de leyes de recurrencia mayores, es decir $a_n=a_{n-1}+a_{n-2}+a_{n-3}$ y obtener un espacio de 3 dimensiones...

También he encontrado ejemplos de este tipo en el primer capítulo del libro de teoría analítica de números de Newman (¡que es una lectura de ocio increíble!)

22voto

Michael Greinecker Puntos 4751

El algoritmo de clasificación de páginas de Google utiliza muchos conceptos e ideas del álgebra lineal .

22voto

Krisztina Puntos 31

Mi aplicación favorita del álgebra lineal, tal y como me la presentó Fan Chung, es Oddtown (de la que me enteré por un manuscrito de Lovasz, pero puede que no se deba a él).

El $n$ A los residentes de Oddtown les encanta formar clubes; llama a la familia de estos $\mathcal{F}$ . Si $F_1$ y $F_2$ ( $F_1 \neq F_2$ ) están en $\mathcal{F}$ entonces $|F_1|$ debe ser impar (¡esto es Oddtown!) y $|F_1 \cap F_2|$ debe ser par ( $\scriptsize{go\;Oddtown?}$ ). La pregunta es, ¿cuántos clubes pueden estos $n$ ¿la gente se forma?

La respuesta (extraída de Notas de la conferencia de Tibor Szabó ) es esta:

Dejemos que $\mathcal{F} = \{F_1,\ldots,F_m\} \subseteq 2^{[n]}$ ser un conjunto de clubes en Oddtown. Sea $\mathbf{v}_i \in \{0,1\}^n$ sea el vector característico de $F_i$ La $j$ es 1 si $j \in F_i$ .

Tenga en cuenta que $\mathbf{v}_i^T v_j = |F_i \cap F_j|$ .

Ahora, $\mathbf{v}_1,\ldots,\mathbf{v}_m$ es independiente sobre $\mathbb{F}^n_2$ : si $\lambda_1\mathbf{v}_1 + \cdots + \lambda_m\mathbf{v}_m = 0$ , entonces para cada $i$ tenemos $$0 \;=\; (\lambda_1\mathbf{v}_1 + \cdots + \lambda_m\mathbf{v}_m)^T\mathbf{v}_i \;=\; \lambda_1\mathbf{v}_1^T\mathbf{v}_i + \cdots + \lambda_i\mathbf{v}_i^T\mathbf{v}_i + \ldots + \lambda_m\mathbf{v}_m^T\mathbf{v}_i \;=\; \lambda_i $$

Desde $\mathbf{v}_1,\ldots,\mathbf{v}_m$ son vectores linealmente independientes sobre $\mathbb{F}^n_2$ , $m \leq n$ y Oddtown puede tener como máximo $n$ clubes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X