Proyección ortogonal en ${\mathbb R}^n$ puede pensarse como si se hiciera brillar una luz sobre un objeto y se observara la sombra que proyecta en la pared más lejana. Esto simplifica demasiado, porque la "pared lejana" es un plano, así que estamos proyectando hacia abajo en dos dimensiones como máximo, pero no es una mala imagen para empezar.
Cuando proyectamos, reducimos el número de dimensiones que consideramos (lo que a veces se denomina "poner las coordenadas a cero") para hacernos una idea de las propiedades macroscópicas del objeto. Su segundo punto lo expresa: cuando reducimos el número de dimensiones en las que consideramos un objeto, estamos perdiendo parte del objeto y, por tanto, el resultado final no puede crecer, sino quedarse igual o encogerse. (Matemáticamente: si $v = (v_1, v_2, \ldots ,v_n)\in {\mathbb R}^n$ es nuestro vector y $Pv = (w_1, w_2, \ldots ,w_n)$ es una proyección ortogonal entonces tenemos $|w_n| \leq |v_n|$ para cada $n \in {\mathbb N}$ así que $v$ es "más pequeño" en algún sentido que $Pv$ ).
Su primer punto expresa el concepto de que la proyección ortogonal preserva la orientación: cualquiera que sea la dirección del vector $v-w$ puntos (es decir, qué signo tiene), la proyección $Pv-Pw$ apunta en la misma dirección (tiene el mismo signo).