1 votos

Resolución de una ecuación matricial con tensores

Mientras investigaba, me encontré con la siguiente ecuación matricial en $W \in \mathbb{R}^{n \times d}$ que no pude resolver.

$$ \sum_{i=0}^{t} X_{i} W Y_{i} + X'_{i}WY'_{i} = Z $$

donde

  • $X_{i}, X'_{i} \in \mathbb{R}^{n \times d \times n}$

  • $Y_{i}, Y'_{i} \in \mathbb{R}^{d \times 1}$

  • $Z \in \mathbb{R}^{n \times d \times 1}$

No hay relación entre $t$ , $n$ y $d$ .

Intenté usar $WY_{i}$ y $WY'_{i}$ como $K_{i}$ y $J_{i}$ e intenté resolverlo mediante mínimos cuadrados de forma que pudiera resolver W a partir de la solución obtenida, pero no obtenía la solución correcta ( $K_{i}$ y $J_{i}$ ). ¿Existe alguna forma analítica de resolver W?

0voto

greg Puntos 156

$ \def\o{{\tt1}} \def\bbR#1{{\mathbb R}^{#1}} \def\qiq{\quad\implies\quad} \def\LR#1{\left(#1\right)} \def\shape#1{\operatorname{Reshape}\LR{#1}} \def\vc#1{\operatorname{vec}\LR{#1}} $ Definir un tensor de tercer orden $\nu$ con componentes $$\eqalign{ \nu_{\ell jk} &= \begin{cases} \o\quad{\rm if}\;\;\ell=j+kn-n \\ 0\quad{\rm otherwise} \end{cases} \qquad \qquad \\ }$$ $$\eqalign{ 1&\le\; j \;&\le n &\qquad\big({\rm the}\;row\;{\rm index}\big) \\ 1&\le\; k \;&\le d &\qquad\big({\rm the}\;column\;{\rm index}\big) \\ 1&\le\; \ell \;&\le n\!\cdot\!d &\qquad\big({\rm the}\;long\;{\rm index}\big) \\ }$$ Un producto de doble punto $(:)$ con este tensor se reformará cualquier matriz $A\in\bbR{n\times d}\,$ en un vector $a\in\bbR{nd\times\o}$ conservando cada componente $$\eqalign{ &a = \nu:A = \vc{A} &\qiq a_\ell = \sum_{j=\o}^n\sum_{k=\o}^d \nu_{\ell jk}\,A_{jk} \\ &M_i = \nu:X_i &\qiq (M_i)_{\ell p} = \sum_{j=\o}^n\sum_{k=\o}^d \nu_{\ell jk}\,(X_i)_{jkp} \\ }$$ En la segunda línea, $\nu$ reformó un tensor $\in\bbR{n\times d\times n}\,$ en un tensor de menor rango $\in\bbR{nd\times n}$

Utiliza este tensor para remodelar las variables $(X_k,\,X_k^\prime,\,Z)$ en variables matriciales y vectoriales normales $$\eqalign{ M_k &= \nu:X_k,\qquad N_k &= \nu:X_k^\prime,\qquad z &= \nu:Z }$$ Reformule la ecuación completa en una ecuación matricial-vectorial normal, que puede ser vectorizada para aislar el $W$ matriz como un vector, que luego se puede volver a convertir en una matriz $$\eqalign{ &\vc{\sum_k M_kWY_k + N_kWY_k = z} \\ &\LR{\sum_k Y_k^T\otimes M_k + Y_k^T\otimes N_k}w = z \\ &w = \LR{\sum_k Y_k^T\otimes M_k + Y_k^T\otimes N_k}^{-1}z \\ &W = \shape{w,n,d} \;=\; w\cdot \nu \\ }$$ En la última línea, observe que el $\nu$ también se puede utilizar el tensor para remodelar el $\,\bbR{nd\times\o}$ vector en a $\,\bbR{n\times d}$ matriz utilizando un producto punto estándar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X