3 votos

¿Por qué el producto punto de dos vectores $\mathbf{x},\mathbf{y}$ lo mismo que $x^T y$ ?

Siempre he pensado que un $1\times 1$ matriz no es lo mismo que un escalar. Sin embargo, en $\textbf{many}$ veces a lo largo de mi primer año en la licenciatura, veo a la gente intercambiar $x\cdot y$ avec $x^T y$ (un escalar en el primero, y un $1\times 1$ matriz en este último).

¿Se trata de una notación descuidada/vagabunda?

Seguramente habrá casos en los que el uso de uno u otro "rompa" el funcionamiento de una pregunta.

Por ejemplo
Dejemos que $\mathbf{x,y}$ sean vectores en $\mathbb{R}^3$ y que $X$ ser un $2\times 2$ matriz.

Entonces $(x\cdot y)X$ se define, sin embargo $x^T y X$ no está definido.

¿Existe una situación en la que tratarlos como equivalentes sea beneficioso?

2voto

user370007 Puntos 20

Su afirmación es correcta.

Sin embargo, en la práctica, ya que el $1\times 1$ Las matrices son isomorfas al campo base (es decir, se comportan como escalares), podemos definir su producto con otras matrices como producto escalar, pero manteniendo las propiedades de los productos matriciales.

EDIT: Con "Su declaración es correcta", me refiero a eso, en sentido estricto, $(x^T y)X$ no se define como producto matricial.

1voto

Lars Truijens Puntos 24005

Si este tipo de argumento le incomoda, puede sortear cualquier dificultad formulando el siguiente teorema sencillo:

"Si $k$ es un escalar, y $[k]$ la correspondiente $1 \times 1$ matriz, y si $X$ es un $n \times 1$ (es decir, un vector de columnas), entonces la igualdad $$ kX = X[k] \tag{$ * $} $$ se mantiene".

Esto es cierto por razones triviales (por cómo son las cosas definido ), y es precisamente en esta situación donde se suele aplicar este truco, como cuando se deriva la matriz $I - 2 \mathbf{n}^t \mathbf{n}$ para la reflexión $R$ en un hiperplano con normal unitaria $\mathbf{n}$ : $$ R(\mathbf{x}) = \mathbf{x} - 2 \underbrace{(\mathbf{x} \cdot \mathbf{n})}_{\text{scalar}} \mathbf{n} \overset{(*)}{=} I\mathbf{x} - 2 \mathbf{n} \underbrace{(\mathbf{n}^t \mathbf{x})}_{\text{$ 1\Nveces 1 $}} = (I - 2 \mathbf{n}^t \mathbf{n}) \mathbf{x}. $$

0voto

Andreas Puntos 36

$x \cdot y$ se entiende comúnmente, si no se hace referencia a las matrices, como el producto escalar. Es decir $x \cdot y = \sum_{i=1}^N x_i y_i$ .

En notación matricial, $x \cdot y$ sólo se definirá si ambos $x$ et $y$ son $N \times N$ matrices, de lo contrario es indefinido. Si ambas $x$ et $y$ son $N \times K$ matrices, tiene que especificar si quiere $x^T \cdot y$ o $x \cdot y^T$ . Entonces el resultado será $N \times N$ o $K \times K$ . En particular, si cualquiera de los dos $N$ o $K$ es igual a 1, se vuelve al producto escalar en uno de los dos casos $x^T \cdot y$ o $x \cdot y^T$ . Visualice esto como matrices de la siguiente manera:

$\left( {{x_1 \atop \vdots} \atop x_N} \right)^T \cdot \left( {{y_1 \atop \vdots} \atop y_N} \right) = (x_1, \dots, x_N) \cdot \left( {{y_1 \atop \vdots} \atop y_N} \right) = \sum_{i=1}^N x_i y_i$

y

$(x_1, \dots, x_N) \cdot (y_1, \dots, y_N)^T = (x_1, \dots, x_N) \cdot \left( {{y_1 \atop \vdots} \atop y_N} \right) = \sum_{i=1}^N x_i y_i$

Así que al contrario de lo que dices, $ (x⋅y)X$ se define sólo si $x⋅y$ se entiende como el producto vectorial escalar, sin embargo debe evitarse ya que es una notación "descuidada" que mezcla vectores y matrices. Si $x$ et $y$ fueran matrices, no se definiría de forma general.

$ x^T y X $ se define sin problemas (todas son matrices), si se interpreta el orden de las operaciones como $ (x^T y) X $ .

0voto

Morgan Rodgers Puntos 3629

Es un abuso muy práctico de la notación (quizá dudaría en llamarlo pereza). El conjunto de $1 \times 1$ matrices sobre un campo $\mathbb{F}$ se comportan exactamente como $\mathbb{F}$ cuando se multiplican entre sí. En otras palabras, el $1 \times 1$ matrices ellos mismos forman un campo que es no son técnicamente idénticos a $\mathbb{F}$ , pero es isomorfo . Así que tiene sentido identificarlos.

Técnicamente, querríamos utilizar el producto punto $x \cdot y$ para indicar que queremos un escalar, o podemos utilizar la notación técnica $x^{*}y$ esto significa que estamos tomando el vector $x$ y sustituirlo por un funcional lineal llamado $x^{*}$ . Los funcionales lineales son mapas lineales de $V \to \mathbb{F}$ este nuevo mapa $x^{*}$ resulta que se parece a $x^{T}$ excepto cuando lo multiplicamos por $y$ obtenemos un escalar en lugar de un $1 \times 1$ matriz.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X