2 votos

función de distorsión para el algoritmo k-means

Estaba leyendo los apuntes de la conferencia de Andrew Ng sobre la agrupación K-mean, en la que la función de distorsión se define de la siguiente manera $$J(c,\mu) = \sum^m_{i=1} || x^{(i)} - \mu_{c^{(i)}}||^2$$

Estoy desconcertado por la $L_2$ norma, ya que $|| x^{(i)} - \mu_{c^{(i)}}||^2 $ implicaría $\sum^m_{i=1} (x^{(i)} - \mu_{c^{(i)}})^2$ y esto significa que habría dos sumas $\sum_{i=1}^m$ en toda la expresión.

Siento que he entendido mal algo crucial aquí. Por favor, indíqueme el error. Gracias.

ACTUALIZACIÓN: el problema tiene un conjunto de entrenamiento dado $\{x^{(1)}, ..., x^{(m)}\}$ , donde $x^{(i)} \in \mathbb{R}^n$ y los centros de los clusters son $\mu_1, \mu_2,...\mu_k \in \mathbb{R}^n$

3voto

Ben Puntos 101

Como la norma se aplica a vectores de dimensión $n$ , $$|| x^{(i)} - \mu_{c^{(i)}}||^2 = \sum^n_{j=1} (x^{(i)}_j - \mu_{c^{(i)},j})^2$$

con $x^{(i)} = (x^{(i)}_1,..., x^{(i)}_n)$ y $\mu_{c^{(i)}}=(\mu_{c^{(i)},1},..., \mu_{c^{(i)},n})$ .

La suma es primero en el $m$ puntos de la muestra ( $x^{(i)}$ ) y luego en su $n$ componentes, así: $$J(c,\mu) =\sum^m_{i=1}\sum^n_{j=1} (x^{(i)}_j - \mu_{c^{(i)},j})^2$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X