Permítame decirle de dónde saqué esta pregunta: Es de un artículo escrito por Yun-Bin Zhao, Approximation Theory of Matrix Rank Minimization and Its Application to Quadratic Equations. En la versión publicada se omite el procedimiento para obtener el problema dual, pero, por casualidad lo encontré en el preprint one :
este es el procedimiento en detalle, la única información requerida es que :
si formulamos el SDP en la forma : $$ \begin{array}{rll} {\displaystyle\min_{X \in \mathbb{S}^n}} & \langle C, X \rangle_{\mathbb{S}^n} & \\ \text{subject to} & \langle A_i, X \rangle_{\mathbb{S}^n} = b_i, \quad i = 1,\ldots,m & (P) \\ & X \succeq 0 & \end{array} $$ El problema dual viene dado por : $$ \begin{array}{rll} {\displaystyle\max_{y \in \mathbb{R}^m}} & \langle b, y \rangle_{\mathbb{R}^m} & \\ & & (D) \\ \text{subject to} & {\displaystyle\sum_{i=1}^m} y_i A_i \preceq C & \end{array} $$
donde para dos matrices cualesquiera P y Q, $P \succeq Q$ significa $P-Q \succeq 0$ .
a partir de la cual podemos comprobar fácilmente que el dual de (observaré que por $(P')$ ) :
\begin{equation} \min \{\langle C_0, W \rangle : \langle C_i, W\rangle = b_i, i=1, ..., l, ~ \delta_1\leq \langle C, W \rangle \leq \delta_2, ~ W \succeq 0, \} \end{equation} viene dada por \begin{equation} \max \left\{ b^T y + \delta_1 t_1 +\delta_2 t_2: ~ \sum_{i=1}^l y_i C_i +(t_1 +t_2) C \preceq C_0, ~t_1\geq 0, ~t_2\leq 0 \right\}, \end{equation} donde $b=(b_1, ..., b_l)^T$ . ( nota que $b^Ty=\langle b, y \rangle_{\mathbb{R}^m}$ :) )
Para obtener el problema dual del problema de mi pregunta, reescribamos el problema como la forma de (P) . Obsérvese que las condiciones semidefinidas positivas (restricción) en el problema de mi pregunta son equivalentes a :
$$ W' =\begin{pmatrix} X & 0 & 0 & 0 & 0\\ 0 & I & X & 0 & 0 \\ 0 & X & Z & 0 & 0 \\ 0 & 0 & 0 & Y & X \\ 0 & 0 & 0 & X & Z+\varepsilon I \end{pmatrix} \succeq 0 . $$ Dejemos que $ E^{(k, l)} \in S^ {5n\times 5n} $ ( $k,l=1,..., 5n)$ denotan las matrices simétricas con $(k, l)$ Esta entrada = $(l, k)$ la entrada $= 1$ y cero en el resto. Cuando $k=l$ , $ E^{(k, k)} $ denota la matriz con ( $k,k)$ 1 y todos los demás elementos 0. Claramente, tenemos $E^{(l,k)}=E^{(k,l)}$ para cualquier $(k,l).$ Obsérvese que para cualquier matriz $W=(w_{i,j}) \in S^{5n\times 5n},$ se puede representar como $W=\sum_{k=1}^{5n} \sum_{l=k}^{5n} w_{k,l}E^{(k,l)},$ y $ \langle E^{(k, l)}, W \rangle = w_{k,l}+w_{l,k} = 2w_{k,l}$ para $k\not=l,$ y $ \langle E^{(k, k)}, W \rangle = w_{k,k}. $ En en términos de $E^{(\cdot, \cdot)},$ la condición ( $W' \succeq 0 $ ) puede escribirse como el siguiente conjunto de restricciones
$$ \begin{array} & &W & \succeq & 0 , \\ 1& \langle E^{(i, ~n+j)}, W \rangle & = & 0, ~~i = 1, ..., n, j=1,..., 4n, \\ 2& \langle E^{(n+i, ~3n+j)}, W \rangle & = & 0, ~~i,j = 1, ..., 2n, \\ 3& \langle E^{(n+i, ~n+j)}, W \rangle & = & 0, ~ i=1, ..., n-1, j=i+1,..., n, \\ 4& \langle E^{(n+i, ~n+i)}, W \rangle & = & 1, ~ i=1,..., n, \\ 5& \langle E^{(i,j)}-E^{(n+i, ~2n+j)}, W \rangle & = & 0, ~~ i=1,..., n-1, ~ j=i+1, ..., n, \\ 6& \langle E^{(j,i)}-E^{(n+j, ~2n+i)}, W \rangle & = & 0, ~i=1,..., n-1, ~j=i+1, ..., n, \\ 7& \langle 2 E^{(i,i)}-E^{(n+i, ~2n+i)}, W \rangle & = & 0, ~~ i =1, ..., n, \\ 8& \langle E^{(n+i,2n+j)}-E^{(3n+i, ~4n+j)}, W \rangle & = & 0, ~~ i,j=1, ..., n, \\ 9& \langle E^{(4n+i, ~4n+j)}- E^{(2n+i, ~2n+j)} , W \rangle & = & 0, ~~i=1,..., n-1, j =i+1,..., n , \\ 10& \langle E^{(4n+i, ~4n+i)}- E^{(2n+i, ~2n+i)} , W \rangle & = & \varepsilon, ~~i=1, ..., n , \end{array} $$
donde (1) y (2) representan los bloques cero de la matriz $W'$ las condiciones (3) y (4) describen el bloque $I$ (el $n\times n $ matriz de identidad), las condiciones (5) a (8) representan la $X$ bloques, y (9) y (10) describen la relación entre los bloques $Z$ y $Z+\varepsilon I$ en el mismo.
En términos de $W\in S^{5n\times 5n},$ la igualdad $\langle A_i, X\rangle =0$ en el problema de mi pregunta se puede escribir como $\langle P_i, W\rangle =0, $ la desigualdad $ 1\leq \textrm{tr}(X)\leq \sqrt{n} $ puede representarse como $ 1 \leq \langle P_0 , W \rangle \leq \sqrt{n}, $ y el objetivo de problema de mi pregunta se puede escribir como $\langle P, W\rangle $ donde $P_i,P_0, P\in S^{5n\times 5n}$ vienen dadas por : $$ P_i = \left[ \begin{array}{cc} A_i & 0\\ 0& 0 \\ \end{array} \right], ~ P_0 = \left(\begin{array}{cc} I & 0 \\ 0 & 0 \end{array} \right), ~ P= \left(\begin{array}{ccc} 0 & & \\ & \left(\begin{array} {cc} 0 & \\ & \frac{1}{\eta} I \end{array} \right) & \\ & & \left(\begin{array}{cc} I & \\ & 0 \end{array} \right) \end{array} \right), $$ Así, El problema de mi pregunta se puede escribir como el siguiente problema SDP: $$ \begin{eqnarray} & \min & \left\langle P, W \right\rangle \\ & \textrm{s.t.} & \langle E^{(i, ~n+j)}, W \rangle =0, ~~i = 1, ..., n, j=1,..., 4n, \\ & & \langle E^{(n+i, ~3n+j)}, W \rangle =0, ~~i,j = 1, ..., 2n, \\ & & \langle E^{(n+i, ~n+j)}, W \rangle = 0, ~ i=1, ..., n-1, ~j=i+1, ..., n, \\ & & \langle E^{(n+i, ~n+i)}, W \rangle = 1, ~ i=1, ..., n, \\ & & \langle E^{(i,j)}-E^{(n+i, ~2n+j)}, W \rangle =0, ~i=1,..., n-1, ~j=i+1, ..., n, \\ & & \langle E^{(j,i)}-E^{(n+j, ~2n+i)}, W \rangle =0, ~i=1,..., n-1, ~j=i+1, ..., n, \\ & & \langle 2 E^{(i,i)}-E^{(n+i, ~2n+i)}, W \rangle =0, ~~ i =1, ..., n, \\ & & \langle E^{(n+i,2n+j)}-E^{(3n+i, ~4n+j)}, W \rangle =0, ~~ i,j=1, ..., n, \\ & & \langle E^{(4n+i, ~4n+j)}- E^{(2n+i, ~2n+j)}, W \rangle =0, ~~i=1,..., n-1,~ j =i+1, ..., n , \\ & & \langle E^{(4n+i, ~4n+i)}- E^{(2n+i, ~2n+i)}, W \rangle =\varepsilon, ~~i=1, ..., n , \\ & & \left\langle P_i, W \right\rangle = 0, ~~ i=1, ..., m, \\ & & 1 \leq \langle P_0 , W \rangle \leq \sqrt{n}, \\ & & W \succeq 0 \end{eqnarray} $$ que es de la forma ( $P'$ ). Así, su problema dual viene dado por : \begin{eqnarray*} & \max & \sum_{i=1}^n \alpha_i+ \sum_{i=1}^n \varepsilon \beta_i + t_1+ \sqrt{n} t_2 \nonumber \\ & \textrm{s.t.}& \nonumber \\ & & \sum_{i=1}^n\sum_{j=1}^{4n} \rho_{ij} E^{(i, n+j)} + \sum_{i,j=1}^{2n} \rho'_{ij} E^{(n+i, 3n+j)} + \sum_{i=1}^{n-1}\sum_{ j=i+1 }^n \rho''_{ij} E^{(n+i, n+j)} \nonumber \\ & & + \sum_{i=1}^n \alpha_i E^{(n+i, n+i)} + \sum_{i=1}^{n-1}\sum_{ j=i+1 }^n \left[ \xi_{ij} (E^{(i,j)}-E^{(n+i, 2n+j)}) + \xi'_{ij} (E^{(j,i)}-E^{(n+j, 2n+i)}) \right] \\ & & + \sum_{i=1}^{n} \eta_{i} (2E^{(i,i)}-E^{(n+i, 2n+i)}) + \sum_{i,j=1 }^{n} \theta_{ij} (E^{(n+i,2n+j)}-E^{(3n+i, 4n+j)}) \nonumber\\ & & + \sum_{ i=1}^{n-1}\sum_{ j=i+1 }^{n} \theta'_{ij} (E^{(4n+i, 4n+j)}- E^{(2n+i,2n+j)}) + \sum_{i=1 }^{n} \beta_i (E^{(4n+i, 4n+i)}- E^{(2n+i,2n+i)}) \nonumber\\ & & + \sum_{i=1}^m y_i P_i +t_1 P_0+t_2 P_0 \preceq P, \nonumber\\ & & t_1\geq 0, ~ t_2\leq 0. \nonumber \end{eqnarray*}
Por la estructura de $ P, P_0 , E^{(\cdot,\cdot)}$ 's y $P_i$ el problema anterior puede escribirse como \begin{eqnarray} & ~~~\max & \sum_{i=1}^n \alpha_i+ \sum_{i=1}^n \varepsilon \beta_i + t_1+\sqrt{n} t_2 ~~\left( = \textrm{tr}(\Phi) -\varepsilon \textrm{tr}(Q) + t_1+\sqrt{n} t_2\right) \nonumber \\ &\textrm{ s.t.}& \nonumber \\ & & \left( \begin{array}{ccccc} V+V^T +\sum_{i=1}^m y_i A_i+(t_1+t_2)I & U_1 & U_2 & U_3 & U_4 \\ U_1^T & \Phi & \Theta-V & U_5 & U_6 \\ U_2^T & \Theta^T-V^T & Q-\frac{1}{\eta}I & U_7 & U_8 \\ U_3^T & U_5^T & U_7^T & -I & -\Theta \\ U_4^T & U_6^T & U_8^T & -\Theta^T & -Q \\ \end{array} \ right) \preceq 0, \\\ ~ t_1\geq 0, ~ t_2\leq 0, \ ~nonumber & & t_1\geq 0, ~ t_2\leq 0, \number \N - fin{eqnarray}
donde $\alpha_i$ y $-\beta_i$ son las entradas diagonales de $\Phi$ y $Q$ respectivamente.
Espero que disfrutes leyendo la respuesta, personalmente fue muy agradable leer este artículo de Zhao.
3 votos
La traducción al formato estándar es sin duda no el primer paso para encontrar el dual. De hecho, usted obtener la dualidad equivocada si lo haces. Sí, será "equivalente" en cierto sentido, pero no será sencillo trasladar las variables duales que obtengas al problema original. En su lugar, debe adjuntar un multiplicador de Lagrange adecuado a cada restricción, y diferenciar con respecto a cada variable primal para encontrar las restricciones de igualdad duales implícitas.
2 votos
Voy a ser sincero: me planteé responder a esta pregunta en su totalidad, pero pronto desistí. La verdad es que es un proceso bastante complejo; no difícil per se, sino que tedioso y propenso a errores . Aún así, es mejor que tratar de convertir a la forma estándar y entonces tomando el doble, pero aún así es un verdadero oso. En particular, hay que romper los multiplicadores de Lagrange para los $2\times 2$ Los IML en los propios bloques. Elogio a cualquier otra persona dispuesta a esforzarse por usted, pero no soy optimista.
0 votos
@Michael C. Grant muchas gracias Michael, intentaré hacerlo. Me gustaría pedirle una recomendación de cualquier fuente de, cálculo práctico de la dualidad de los casos "complicados" o no estándar como este.
0 votos
Bueno, quizás "Optimización por métodos de espacio vectorial" de Luenberger.
0 votos
Gracias Michael, me he tomado mi tiempo para hojearlo, me parece muy bonito y familiar, quizás porque conozco algunos de los temas tratados ( como álgebra lineal, espacio de Banach y Hilbert, convexidad y semicontinuidad), pero no hay solución a los problemas :) donde busco libros de autoestudio. Será de gran ayuda si me dices algún libro destacable para ti en ese sentido.
0 votos
He encontrado la solución. Ok, no soy yo quien ha hecho el razonamiento, pero estuve muy cerca. Voy a tratar de escribirlo aquí, pero no veo cómo hacerlo, no hay opciones de edición como en la primera vez cuando escribí la pregunta, y la limitación del número de caracteres no hacen que sea fácil. editar : Acabo de descubrir cómo hacerlo :), pero voy a escribir la solución más tarde, no tengo suficiente tiempo ahora.
0 votos
En realidad, si has resuelto tu problema, aunque sea parcialmente, deberías publicar un respuesta ¡! De hecho, aquí se anima a hacerlo. Recuerda que uno de los propósitos de Math.SE es recopilar preguntas interesantes y sus respuestas en beneficio de futuros lectores. Estoy seguro de que tu trabajo beneficiará a otros.
0 votos
Sí, probablemente lo haré esta noche. Pero qué pasa con mi pregunta sobre los libros de auto-estudio. No te obligo a contestar pero supongo que no has leído la pregunta porque el comentario está separado :).
0 votos
@MichaelC.Grant Hola Michael, ¿puedes indicarme una referencia que derive el dual del problema SDP estándar? Por ejemplo, en la respuesta dada por el propio OP, dice que (P) y (D) son duales entre sí. ¿Cómo puedo derivar ese resultado? No soy capaz de encontrar una referencia.