Robusto PCA (como el desarrollado por Candes et al 2009 o mejor aún Netrepalli et al 2014) es un método popular para la detección de valores atípicos multivariantes, pero la distancia de Mahalanobis también puede ser utilizado para la detección de valores atípicos dado un robusto, regularización de la estimación de la matriz de covarianza. Tengo curiosidad acerca de la (des)ventajas de la utilización de un método sobre el otro.
Mi intuición me dice que la mayor diferencia entre los dos es la siguiente: Cuando el conjunto de datos es "pequeña" (en el sentido estadístico), robusto PCA dará un menor rango de covarianza mientras que las fuertes matriz de covarianza de la estimación que le dará un rango completo de covarianza debido a la Ledoit-Lobo de regularización. ¿Cómo afecta esto a su vez afecta a la detección de valores atípicos?