La multiplicación de matrices — tomando el producto escalar de la $i$ésima fila de la primera matriz y el $j$ésima columna de la segunda ceder el $ij$ésima del producto — no es muy intuitivo: si le pregunta a alguien cómo mutliply dos matrices, él probablemente no pensaría de ese método. Por supuesto, resulta ser muy útil: la multiplicación de la matriz es, precisamente, la operación que representa la composición de transformaciones. Pero no es intuitivo. Así que mi pregunta es de donde vino. Que el pensamiento de la multiplicación de matrices de esa manera, y por qué? (¿Era tal vez la multiplicación de una matriz y un vector de primera? Si es así, que el pensamiento de la multiplicación de ellos de esa manera, y por qué?) Mi pregunta está intacto, no importa si la multiplicación de la matriz se hace de esta manera sólo después de que fue utilizado como la representación de la composición de transformaciones, o si, por el contrario, la multiplicación de la matriz llegó primero. (De nuevo, no estoy preguntando acerca de la utilidad de la multiplicación de matrices como lo hacemos nosotros: esto es claro para mí. Estoy haciendo una pregunta acerca de la historia.)
Respuestas
¿Demasiados anuncios?La multiplicación de la matriz, es una manera simbólica de la sustitución de un cambio lineal de variables de uno a otro. Si $x' = ax + by$ y $y' = cx+dy$, y $x" = x' + b i'$ y $y" = c x' + d + i'$, a continuación, podemos conectar el primer par de fórmulas en la segunda expresar $x"$ e $s"$ en $x$ y $y$: $$ x" = x' + b y' = a'(ax + by) + b'(cx+dy) = (a + b + c)x + (a'b + b, d)y $$ y $$ y" = c x' + d + i' = c'(ax+by) + d'(cx+dy) = (c a+d + c)x + (c, b+d d)y. $$ Puede ser tedioso para mantener la escritura de las variables, así que el uso de matrices para el seguimiento de los coeficientes, con las fórmulas de $x$ y $x"$ en la primera fila y para $s'$ e $s"$ en la segunda fila. Los dos anteriores lineal sustituciones de coincidir con el de la matriz producto $$ \left( \begin{array}{cc} a'y b'\\c' + d' \end{array} \right) \left( \begin{array}{cc} a&b\\c&d \end{array} \right) = \left( \begin{array}{cc} a+b'c&a'b+b, d\\c a+d c&c, b+d d \end{array} \right). $$ Para la multiplicación de la matriz es sólo una contabilidad de dispositivos para los sistemas de lineales sustituciones conectado a uno de otro (el orden importa). Las fórmulas no son intuitivos, pero no es nada distinto de la simple idea de combinar las dos cambios lineales de las variables en la sucesión.
La multiplicación de la matriz fue definido por primera vez de forma explícita en la impresión de Cayley en 1858, con el fin de reflejar el efecto de la composición de transformaciones lineales. Véase el párrafo 3 a http://darkwing.uoregon.edu/~vitulli/441.sp04/LinAlgHistory.html. Sin embargo, la idea de que el seguimiento de lo que sucede a los coeficientes cuando un cambio lineal de variables se sustituye en la otra (la que vemos como la multiplicación de la matriz) se va a volver más. Por ejemplo, el trabajo de número de teóricos en el siglo 19 en la formas cuadráticas binarias $ax^2 + bxy + cy^2$ estaba lleno de cambios lineales de las variables conectado en cada uno de los otros (especialmente los cambios lineales de la variable que queremos reconocer como procedente de ${\rm SL}_2({\mathbf Z})$). Para más información sobre el fondo, consulte el artículo de Thomas Hawkins en la teoría de la matriz, en 1974, al ICM. Google "ICM 1974 Thomas Hawkins" y usted encontrará su papel entre los 3 primeros éxitos.
Aquí hay una respuesta que reflejan directamente la perspectiva histórica de papel de la Memoria sobre la teoría de matrices Por Authur de Cayley, 1857. Este artículo está disponible aquí.
Este papel se le atribuye ", que contiene la primera definición abstracta de una matriz" y "un álgebra de matrices definición de adición, multiplicación, multiplicación escalar y recíproca" (fuente).
En este trabajo no estándar se utiliza la notación. Voy a hacer mi mejor esfuerzo para colocarlo en el más "moderno" (pero todavía no estándar) notación. La mayor parte de los contenidos de este post va a venir de las páginas 20 y 21.
Para introducir la notación $$ (X,Y,Z)= \left( \begin{array}{ccc} a & b & c \\ a' y b' y c' \\ un" & b" y c" \end{array} \right)(x,y,z)$$
representan el conjunto de funciones lineales $(ax + by + cz, z + b y + c z, una"z + b"y + c"z)$, que luego se denominan $(X,Y,Z)$.
Cayley define la suma y la multiplicación escalar y luego se traslada a la multiplicación de la matriz o "composición". Él específicamente quiere lidiar con el tema de:
$$(X,Y,Z)= \left( \begin{array}{ccc} a & b & c \\ a' y b' y c' \\ un" & b" y c" \end{array} \right)(x,y,z) \quad \text{donde} \quad (x,y,z)= \left( \begin{array}{ccc} \alpha & \beta & \gamma \\ \alpha' & \beta' & \gamma' \\ \alpha" & \beta" & \gamma" \\ \end{array} \right)(\xi\eta,\zeta)$$
Ahora él quiere representar $(X,Y,Z)$ en $(\xi\eta,\zeta)$. Él hace esto mediante la creación de otra matriz que satisface la ecuación:
$$(X,Y,Z)= \left( \begin{array}{ccc} A & B & C \\ A' Y B' Y C' \\ Un" & B" Y C" \\ \end{array} \right)(\xi\eta,\zeta)$$
Sigue escribiendo que el valor que obtenemos es:
$$\begin{align}\left( \begin{array}{ccc} A & B & C \\ A' Y B' Y C' \\ Un" & B" Y C" \\ \end{array} \right) &= \left( \begin{array}{ccc} a & b & c \\ a' y b' y c' \\ un" & b" y c" \end{array} \right)\left( \begin{array}{ccc} \alpha & \beta & \gamma \\ \alpha' & \beta' & \gamma' \\ \alpha" & \beta" & \gamma" \\ \end{array} \right)\\[.25 cm] &= \left( \begin{array}{ccc} un\alpha+b\alpha' + c\alpha" y un\beta+b\beta' + c\beta" y un\gamma+b\gamma' + c\gamma" \\ un'\alpha+b'\alpha' + c'\alpha" & a'\beta+b'\beta' + c'\beta" & a'\gamma+b'\gamma' + c'\gamma" \\ un"\alpha+b"\alpha' + c"\alpha" & "\beta+b"\beta' + c"\beta" & "\gamma+b"\gamma' + c"\gamma"\end{array} \right)\end{align}$$
Esta es la definición estándar de la multiplicación de la matriz. Yo creo que la multiplicación de la matriz se ha definido para lidiar con este problema específico. El papel sigue a mencionar varias propiedades de la multiplicación de la matriz como el de la no-conmutatividad, la composición con la unidad y cero y exponenciación.
Aquí está el escrito de la regla de composición:
Cualquier línea de los compuestos de la matriz se obtiene mediante la combinación de la línea correspondiente de la primera componente de la matriz sucesivamente con varias columnas de la segunda matriz (p. 21)
\begin{align} u & = 3x + 7y \\ v y = -2x + 11y \\ \\ \\ \\ p & =13u-20v \ \ & q = 2u+6v \end{align} Dado que $x$ y $y$, ¿cómo encontrar $p$ y $q$? ¿Cómo se escribió \begin{align} p & = \bullet x + \bala y \\ q & = \bullet x+\bala y\quad\text{?} \end{align} Qué números van a donde los cuatro $\bullet$s son?
Esa es la multiplicación de la matriz. La razón es matemático, no histórico.