Estoy ejecutando kmeans para un estudio de investigación de mercado, y tengo un par de preguntas:
-
¿Debo estandarizar mis datos, y si es así, cómo? Por ejemplo, una de las variables que tengo es la demanda de productos, que se mide en una escala de siete puntos. Por otro lado, también tengo una variable de edad, que está en una escala muy diferente. ¿Debo estandarizarlas, y cómo?
-
¿Puedo usar variables categóricas en kmeans? Específicamente, me gustaría usar el género y la etnia. Si es posible, ¿cómo debería preparar estos datos para el análisis de clústeres? Supongo que les asignaría números, pero ¿cómo los estandarizaría con mis otros datos?
-
Descargué el software de código abierto Cluster 3.0. ¿Es bueno para usarlo?
0 votos
Solo para el futuro, esta pregunta podría ser mejor si se hace como tres preguntas separadas.
0 votos
Creo que la respuesta a esta pregunta puede ayudarte. datascience.stackexchange.com/questions/22/…