Tengo un conjunto de datos de panel (país y año) sobre el que me gustaría realizar un análisis de conglomerados por países. Mi conjunto de datos tiene unas 20 variables.
Este es un resumen de mis datos de panel:
panel variable: country (strongly balanced) time variable: year, 2010 to 2013
Ejecutar un análisis de clústeres de kmeans sólo con los datos de 2013 es bastante sencillo. Pero, ¿cómo se haría el análisis teniendo en cuenta todas las observaciones del periodo 2010-2013? ¿Es la agrupación de k-means un enfoque apropiado?
Esto es lo que ejecuté en Stata sólo para 2013:
cluster kmeans var1 var2 var3 var4 var5 var6 if year==2013, k(4) name(test1)
Gracias.
0 votos
La estructura de panel del conjunto de datos haría una interpretación impar del resultado. Podría obtener las mismas personas en diferentes grupos. ¿Tal vez sea esto lo que quiere? Muchos científicos del clima utilizan algo llamado funciones ortogonales empíricas, que según tengo entendido es básicamente un PCA variable en el tiempo. ¿Podría valer la pena investigarlo para su aplicación?
0 votos
¡Gracias por la sugerencia ACD! En realidad, me gustaría identificar qué países tienen las mismas características. Así que tengo información de unos 30 países, y me gustaría agrupar estos países por características similares. No sé si esto ayuda a entender el problema. Gracias de nuevo.