Resumen: el kernel PCA con kernel lineal es exactamente equivalente al PCA estándar.
Dejemos que $\mathbf{X}$ sea la matriz de datos centrada de $N \times D$ tamaño con $D$ variables en columnas y $N$ puntos de datos en filas. Entonces el $D \times D$ La matriz de covarianza viene dada por $\mathbf{X}^\top\mathbf{X}/(n-1)$ sus vectores propios son los ejes principales y los valores propios son las varianzas del PC. Al mismo tiempo, se puede considerar la llamada matriz de Gram $\mathbf{X}\mathbf{X}^\top$ de la $N \times N$ tamaño. Es fácil ver que tiene los mismos valores propios (es decir, las varianzas de PC) hasta el $n-1$ y sus vectores propios son componentes principales escalados a norma unitaria.
Se trata de un PCA estándar. Ahora, en el kernel PCA consideramos alguna función $\phi(x)$ que mapea cada punto de datos a otro espacio vectorial que suele tener mayor dimensionalidad $D_\mathrm{new}$ posiblemente incluso infinito. La idea del kernel PCA es realizar el PCA estándar en este nuevo espacio.
Como la dimensionalidad de este nuevo espacio es muy grande (o infinita), es difícil o imposible calcular una matriz de covarianza. Sin embargo, podemos aplicar el segundo enfoque del ACP descrito anteriormente. En efecto, la matriz Gram seguirá siendo del mismo tamaño manejable $N \times N$ tamaño. Los elementos de esta matriz vienen dados por $\phi(\mathbf{x}_i)\phi(\mathbf{x}_j)$ que llamaremos función kernel $K(\mathbf{x}_i,\mathbf{x}_j)=\phi(\mathbf{x}_i)\phi(\mathbf{x}_j)$ . Esto es lo que se conoce como el truco del núcleo En realidad, no es necesario calcular nunca $\phi()$ pero sólo $K()$ . Los vectores propios de esta matriz de Gram serán los componentes principales en el espacio objetivo, los que nos interesan.
La respuesta a su pregunta es ahora obvia. Si $K(x,y)=\mathbf{x}^\top \mathbf{y}$ entonces la matriz Gram del núcleo se reduce a $\mathbf{X} \mathbf{X}^\top$ que es igual a la matriz de Gram estándar, y por lo tanto los componentes principales no cambiarán.
Una referencia muy fácil de leer es Scholkopf B, Smola A, y Müller KR, Kernel principal component analysis, 1999 y observe que, por ejemplo, en la Figura 1 se refieren explícitamente al ACP estándar como el que utiliza el producto de puntos como función del núcleo: