La principal diferencia entre t-SNE y UMAP es la interpretación de la distancia entre objetos o "clusters". Utilizo las comillas porque ambos algoritmos no están pensados para el clustering - están pensados sobre todo para la visualización.
t-SNE preserva la estructura local de los datos.
UMAP afirma que preserva tanto la estructura local como la mayor parte de la estructura global de los datos.
Esto significa que con t-SNE no se puede interpretar la distancia entre los clústeres A y B en diferentes extremos de su parcela. No puede inferir que estos clusters son más disímiles que A y C, donde C está más cerca de A en el gráfico. Pero dentro del cluster A, se puede decir que los puntos cercanos entre sí son objetos más similares que los puntos en diferentes extremos de la imagen del cluster.
Con UMAP, debería ser capaz de interpretar tanto las distancias entre / posiciones de los puntos como los clusters.
Ambos algoritmos son muy estocásticos y dependen en gran medida de la elección de los hiperparámetros (el t-SNE incluso más que el UMAP) y pueden producir resultados muy diferentes en distintas ejecuciones, por lo que su gráfico podría ocultar una información en los datos que una ejecución posterior podría revelar.
Por otro lado, el viejo PCA es determinista y fácilmente comprensible con conocimientos básicos de álgebra lineal (multiplicación de matrices y problemas propios), pero es sólo una reducción lineal en contraste con las reducciones no lineales de t-SNE y UMAP.