Según el teorema de Cover (1965), es posible hacer que los patrones sean separables si el espacio de características original se transforma en un espacio de mayor dimensión.
Piensa en el problema XOR.
No es posible separar las dos clases con un hiperplano. Un truco es utilizar las redes neuronales, que transforman el espacio de características linealmente a un espacio de mayor dimensión. Otro es el truco del kernel con transformación no lineal.
Pero, ¿podemos hacer que las clases sean separables sólo con una transformación lineal de baja dimensión, es decir $R^2 \rightarrow R^2$ ¿Transformación lineal? Creo que no encuentro ninguna. ¿Hay alguna manera de demostrar que tal transformación no existe?