6 votos

Similitudes y disimilitudes en el escalamiento multidimensional clásico

Tengo problemas para conciliar varios términos en el MDS. Según [1], sección 14.8, el MDS clásico toma similitudes como entradas. En [2], también citado en Wikipedia , el MDS clásico toma disimilitudes como entradas.

¿Cuál es la terminología acordada?

[1] Hastie, T, R Tibshirani y JH Friedman. The Elements of Statistical Learning. Springer, 2003.

[2] Borg, I., y P. J. F. Groenen. Modern Multidimensional Scaling: Theory and Applications. 2nd edition. New York: Springer, 2005.

2 votos

Supongo que puede estar equivocado. El término "MDS clásico" o "MDS más sencillo" suele entenderse como MDS euclidiano no ponderado, es decir, no el modelo INDSCAL. El MDS clásico trabaja con una matriz. Puede ser de similitudes o de disimilitudes. Por lo general, un programa convierte primero la primera en la segunda y procede. Porque el propio algoritmo suele estar escrito para las disimilitudes.

0 votos

La introducción de similitudes o disimilitudes en la función de tensión al cuadrado conduce a soluciones diferentes (véase la discusión en [1] entre la Ec.(14.100) y la Ec.(14.101)). Por lo tanto, es importante definir lo que entra en la función de tensión.

5voto

zowens Puntos 1417

Estos dos libros coinciden plenamente.

El escalamiento multidimensional clásico (entendiendo por "MDS clásico" el MDS de Torgerson, siguiendo tanto a Hastie et al. como a Borg & Groenen) encuentra puntos $z_i$ tal que sus productos escalares $\langle z_i, z_j \rangle$ aproximar lo mejor posible una matriz de similitud dada. Sin embargo, cualquier matriz de disimilitud puede convertirse en una matriz de similitud: se supone que las disimilitudes son distancias euclidianas, a partir de las cuales pueden calcularse productos escalares centrados y tomarse como similitudes.

Así, el algoritmo del MDS clásico/Torgerson es el siguiente: $$\text{Euclidean distances}\to\text{Centered scalar products}\to\text{Optimal mapping},$$ es decir $$\text{Dissimilarities}\to\text{Similarities}\to\text{Optimal mapping}.$$ Lo que usted considera una "entrada" aquí, no importa realmente.

Esto es exactamente lo que está escrito en Hastie et al:

En cambio, en el escalamiento clásico [a diferencia del escalamiento métrico en general] empezamos con las similitudes [...]. Esto es atractivo porque hay una solución explícita solución en términos de vectores propios [...]. Si tenemos distancias en lugar de productos internos, podemos convertirlas en productos internos centrados si las distancias son euclidianas [...] . Si las similitudes son de hecho productos internos centrados, el escalamiento clásico es exactamente equivalente a los componentes principales [...]. El escalamiento clásico no es equivalente al escalamiento por mínimos cuadrados [que minimiza la reconstrucción de las disimilitudes].

Véase mi respuesta en ¿Cuál es la diferencia entre el análisis de componentes principales y el escalamiento multidimensional? para los detalles matemáticos.

0 votos

Gracias. Lo que dices es que la definición de Borg & Groenen es errónea: el estrés no es una función de las disimilitudes, sino de las similitudes. Dicho de otro modo, el "MDS clásico" de Borg & Groenen es el escalado de mínimos cuadrados de Hastie. ¿Está de acuerdo?

0 votos

No, definitivamente no. Borg y Groenen parecen estar totalmente de acuerdo con Hastie et al., y utilizan el término "escalamiento clásico" (capítulo 12) para referirse al escalamiento de Torgerson, que es lo que también hacen Hastie et al.

0 votos

@amoeba, acabo de navegar por algunos textos sobre MDS y he encontrado una confusión con la definición del término "MDS clásico". Algunas fuentes lo definen como tú, como =Torgerson's MDS aka PCoA. Pero más fuentes lo definen como "modelo euclidiano de matriz única MDS" (yo mismo pensaba así y sigo de acuerdo con esa costumbre). Si admitirlo entonces MDS clásico (aka Identity MDS) es lo que no es el MDS Replicado o el MDS Ponderado/Generalizado (versiones de INDSCAL).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X