Dado que el valor de $\phi_2$ es el doble que el de $\phi_1$ todas las distancias en $\phi_2$ -espacio son el doble de grandes que las distancias en $\phi_1$ -espacio. Esto significa que el margen (que es aproximadamente el "grosor" del hiperplano de separación que aprende la SVM) es también el doble de grande. Podemos mostrar esto con un par de funciones de núcleo aún más simples, $\phi_1(x, y) = (x, y)$ y $\phi_2(x) = (2x, 2y)$ --el principio es exactamente el mismo que con el par de núcleos que sugeriste.
Si tiene un conjunto de datos con puntos positivos en $(0,0), (0,1)$ y puntos negativos en $(1,0), (1,1)$ y, a continuación, utilizando $\phi_1$ aprenderás la siguiente SVM:
Por otro lado, $\phi_2$ multiplica cada coordenada por 2 respecto a $\phi_1$ Así que se aprende el siguiente hiperplano en su lugar:
Como puede ver, como todas las distancias están infladas por un factor de 2, el margen también es mayor.
Apéndice: Código R para los gráficos
do.plot <- function(D, main, sub) {
plot(NA, xlim=c(-0.5, 2.5), ylim=c(-0.5, 2.5), xlab='x', ylab='y', main=main, sub=sub)
points(c(0, 0), c(0, D), pch='+')
points(c(D, D), c(0, D), pch=4)
abline(v=0, lty=2)
abline(v=D, lty=2)
abline(v=D/2)
}
do.plot(1, 'phi1', 'margin=1')
do.plot(2, 'phi2', 'margin=2')