Me estoy encontrando con un problema en cuanto a la Reproducción del Núcleo de Hilbert Espacios (RKHS) en el contexto de aprendizaje de la máquina utilizando Máquinas de Soporte Vectorial (SVMs).
Con referencia a este papel [Olivier Chapelle, 2006], Sección 3, voy a tratar de ser breve y centrado en mi problema, por lo que puede evitar dar rigurosa descripción de lo que estoy utilizando a continuación.
Deje que el siguiente problema de optimización: $$ \displaystyle \min_{\mathbf{w},b}\: \lVert\mathbf{w}\rVert^2 + C\sum_{i=1}^{n}L(y_i, \mathbf{w}\cdot\mathbf{x}_i+b), $$ donde $L(y,t)=\operatorname{max}(0,1-yt)$ es una función de pérdida, la llamada "de la bisagra de la pérdida". Thrying para introducir a los granos, a fin de considerar no-lineal de las SVMs, el autor reformula el mencionado problema de optimización, en busca de una función en un RKHS, $\mathcal{H}$, lo que minimiza el siguiente funcional: $$ F[f]=\lambda\lVert f \rVert^2_\mathcal{H} + \sum_{i=1}^{n}L(y_i, f(\mathbf{x}_i)+b). $$ Yo entiendo lo siguiente de su obra; mi pregunta es la siguiente: Lo que si tenía alguna otra función de pérdida (no la bisagra de la pérdida de arriba), que no se expresa solamente por el interior del producto $\mathbf{w}\cdot\mathbf{x}_i$, lo que -si he entendido bien - es "reemplazado" por $f(\mathbf{x}_i)$, pero en lugar de eso había algo de pérdida en función de la forma: $$ \mathbf{w}\cdot\mathbf{x}_i+b+\sqrt{\mathbf{w}^TA\mathbf{w}}, $$ donde $A$ es positivo-definida simétrica la matriz? Quiero decir, ¿hay alguna manera de expresar el anterior quadrativ formulario ($\sqrt{\mathbf{w}^TA\mathbf{w}}$) utilizando la función de $f$, que puedo expresar mi problema de optimización en el contexto de RKHS?
Por otro lado, la teoría sugiere que, independientemente de la pérdida de la función, $L$, es decir, la solución de reformulted problema sería de la forma: $$ f(\mathbf{x})=\sum_{i=1}^{n}\alpha_ik(\mathbf{x}_i, \mathbf{x}), $$ donde $k$ es el núcleo asociado con la adopción de RKHS. He entendido correctamente? La solución sería la de arriba, incluso si mi pérdida de las funciones que se incluyen términos como"$\sqrt{\mathbf{w}^TA\mathbf{w}}$?
Todo comentario o ayuda sería muy apreciada. Sería bueno si alguien quiere discutir sobre esto. Gracias de antemano!