Tengo datos que representan algún aspecto del comportamiento humano. Quiero clúster (sin supervisión) en perfiles de comportamiento de algún tipo. ahora, algunos de mis variables son categóricas (con 2 o más categorías), y algunos son continuas (la mayoría son porcentajes). Un par de variables son aún más complejo en el que una categoría tiene más continua y el otro no tiene ningún tipo de datos adicionales.
Mi pregunta es acerca de la forma de categorizar los datos. ¿Cuáles son los común (?) enfoques para tratar con él?
No necesito el código o nada, sino que algunas de las referencias o las direcciones que me ayudará a entender mejor cómo lidiar con este desafío.
Si usted sabe de R
funciones que facilitan este tipo de análisis, que sería genial, pero no es necesario.
gracias.