Es bien sabido que el k-means el algoritmo sufre en la presencia de valores atípicos. k-means++ es un método eficaz para el grupo de centro de initalization. Yo estaba pasando por el PPT por los fundadores del método, Sergei Vassilvitskii y David Arthur http://theory.stanford.edu/~sergei/diapositivas/MURCIÉLAGOS-Medios.pdf (lámina 28), que muestra que el centro del cúmulo de inicialización no es afectada por valores atípicos como se ve a continuación.
Como por el k-means++ método, el farthermost puntos son más propensos a ser el inicial de los centros. De esta manera, el valor atípico punto (el de más a la derecha) deben también ser un primer centroide del grupo. ¿Cuál es la explicación de la figura?