He trazado el gráfico de conglomerados bivariantes (de un objeto de partición) utilizando la función clusplot
del cluster
paquete. A continuación se muestra el código para ello:
k.means.fit <- kmeans(pima_diabetes_kmean[, c(input$first_model, input$second_model)], 2)
output$kmeanPlot <- renderPlot({
# K-Means
clusplot(
pima_diabetes_kmean[, c(input$first_model, input$second_model)],
k.means.fit$cluster,
main = '2D representation of the Cluster solution',
color = TRUE,
shade = TRUE,
labels = 5,
lines = 0
)
})
El gráfico muestra el componente 1 en el eje de abscisas y el componente 2 en el eje de ordenadas. Adjunto el siguiente gráfico. ¿El componente 1 se refiere al embarazo y el componente 2 a la glucosa, como en un simple gráfico de puntos? No lo entiendo.
Además, dice que los dos componentes explican el 100% de la variabilidad puntual, ¿qué significa eso exactamente?
Además, ¿por qué los puntos verdes del gráfico de conglomerados son diferentes de los puntos rojos/negros del gráfico de puntos, aunque ambos representen los mismos datos? A continuación se muestra el código para trazar los puntos:
plot(
pima_diabetes_kmean[, c(input$first_model, input$second_model)],
col = alpha(k.means.fit$cluster, 0.2),
pch = 20,
cex = 3
)
points(
k.means.fit$centers,
pch = 4,
cex = 4,
lwd = 4,
col = "blue"
)