Dada una colección de puntos $P \subset \mathbb R^3$ una burda caracterización de la "forma" de $P$ a veces viene dada por los componentes principales. Construimos una matriz de covarianza, por ejemplo, si $P$ es discreto, $C = \displaystyle\sum_{p\in P} (p - \mu)(p - \mu)^\intercal$ , donde $\mu = \displaystyle\frac1{|P|}\sum_{p\in P}\, p$ es el centro de masa. Esto define un elipsoide cuyos semiejes están definidos por los vectores propios unitarios de $C$ , escalado por los valores propios asociados.
Mi pregunta se refiere a la siguiente afirmación:
El elipsoide descrito por los componentes principales es el mejor ajuste elipsoide para $P$ .
Por desgracia, no conozco ningún autor o recurso al que pueda acusar de hacer explícitamente tal afirmación $^*$ . En fin, mi pregunta es:
¿Existe una definición geométrica natural de "elipsoide de mejor ajuste" para para la que la afirmación anterior sea cierta?
Por ejemplo, algún tipo de mínimos cuadrados u otra caracterización variacional de este mismo elipsoide es lo que estoy buscando. También aceptaría una respuesta que me convenciera de que esta es la forma incorrecta de ver los componentes principales, pero eso será difícil de vender.
Si hacemos una traslación de coordenadas, de manera que $v_p = (p - \mu)$ y que $\hat{v}_p = \frac{v_p}{\left\|v_p\right\|}$ y mira $C$ como una transformación lineal que es la suma de los operadores de rango uno en este sistema de coordenadas, $C = \displaystyle\sum_{p \in P} \left\|v_p\right\|^2 \hat{v}_p\hat{v}_p^\intercal$ entonces el elipsoide en cuestión es la imagen de la bola unitaria. De esta caracterización obtengo alguna intuición de por qué este elipsoide en particular es bueno. Estoy buscando una mejor comprensión, preferiblemente desde una perspectiva geométrica.
* La Wikipedia se acerca a tal afirmación en la descripción del momentos : "El 'segundo momento', ... en dimensiones superiores mide la forma de una nube de puntos como podría ser ajustada por un elipsoide".
Editar: Aunque creo que la observación de que el elipsoide refleja la varianza de la distribución gaussiana que tiene la máxima probabilidad de producir $P$ (No me he remangado y lo he comprobado), este no es el tipo de respuesta que busco. Tal vez debería eliminar todas las etiquetas que se refieren a la probabilidad o la regresión.
Voy a concretar la pregunta entonces. Por cosas que he visto en otros lugares de la web, me da la sensación de que este elipsoide es diferente al que minimiza la suma de distancias al cuadrado de los puntos, pero no lo sé con seguridad.
Qué tal esto entonces: el distancia radial desde un punto $p$ al elipsoide es la distancia medida a lo largo de la línea que contiene $p$ y $\mu$ (este último es el origen en nuestro nuevo sistema de coordenadas). Así que esta es mi pregunta:
¿El elipsoide definido anteriormente minimiza la suma de las distancias radiales al cuadrado?
0 votos
El enlace en la nota al pie de página se ve bien en la vista previa, pero no se renderiza correctamente en el post final?
0 votos
Gracias por arreglar eso @J.M.
0 votos
No te preocupes, @yasmar.
1 votos
Tengo la impresión de que se obtendría una interpretación natural de la construcción en cuestión si se sustituye "elipsoide" por "distribución normal multivariante", de forma similar a como una distribución normal con la misma media y varianza es, en cierto sentido, la distribución normal que mejor se ajusta a una distribución dada. Desgraciadamente, no puedo explicar esto porque no sé exactamente cuál es ese sentido, aunque me parece que debería ser fundamental y obvio.
0 votos
@Rahul Gracias. La máxima probabilidad sugerida por Yuval parece que es probablemente correcta. No es el tipo de respuesta que buscaba, pero quizá no haya una interpretación geométrica estándar. Me interesa específicamente el elipsoide (la superficie). ¿Es el elipsoide que minimiza la suma de las distancias al cuadrado a los puntos diferente de éste?
0 votos
Gran pregunta. Creo que has respondido a tu propia pregunta. El método que propones es el mejor ajuste "por componentes principales".