Estuve hablando con un estadístico amigo mío que dijo que en lugar de minimizar esta función $ \sum_ {i,j}W_{ij}d_{ij}^2(X)$ sobre $X$ sería mejor resolver un problema de minimización análogo $ \sum_ {i,j}W_{ij}||f(Y_{i.})-f(Y_{j.})||_ \mathcal {H}$ sobre $f$ en su lugar con la norma que es una norma RKHS (Reproducción del Kernel Hilbert Space) donde las funciones $f(.)$ vienen de un espacio de funciones Hilbert. Ambas minimizaciones están bajo una restricción que $ \sum_ {i,j}d^2_{i,j}(X)$ o $ \sum_ {i,j}||f(Y_{i.})-f(Y_{j.})||_ \mathcal {H}$ está limitado a un valor positivo real fijo $ \nu $ .
Aquí, $d_{ij}^2(X)$ es la distancia euclidiana al cuadrado entre las filas $i,j$ de la verdadera matriz desconocida $X$ . $Y$ es una matriz real fija.
Pregunta: ¿Por qué el último problema bajo el espacio de funciones sería mejor? ¿Qué proporciona la norma RKHS, que es diferente de la distancia/norma euclidiana? A partir de esta descripción, ¿por qué crees que mi amigo académico ha dicho esto, cuando pensaba desde diferentes direcciones matemáticas? ¿Qué estamos ganando o perdiendo entre estas dos formulaciones? Después de todo, una vez que el $f(.)$ se resuelve porque las normas parecen preservar algún tipo de noción de distancia/disimilitud o cercanía. ¿Qué tiene de especial el segundo problema? Entiendo que la pregunta es un poco abierta. ¡Así que por favor siéntase libre de ser verboso al expresar sus pensamientos!
Perspectiva: Le mostré el problema euclidiano inicial. Lo pensó y planteó el otro problema como interesante. Por favor, deseche sus pensamientos.