Un modelo estándar utilizado con datos de panel es el de efectos fijos: $y_{it} = \mu_i + \theta_t + \epsilon_{it}$ donde $i$ es el individuo y $t$ son subíndices temporales. Esto puede estimarse fácilmente con MCO y variables ficticias.
El modelo supone que existe una única serie temporal subyacente, $\theta_t$ para $t = 1,2,...,T$ . Se supone que todos los individuos de los datos siguen esta serie temporal más algún efecto individual, que es constante en relación con el tiempo.
Supongamos, sin embargo, que hay dos o más grupos de individuos, que cada grupo tiene su propia serie temporal y que, antes de mirar los datos, no sabemos quién está en cada grupo. Me gustaría estimar el modelo de efectos fijos en este caso y averiguar qué individuo está en qué grupo / cluster .
El planteamiento que se me ha ocurrido es que el modelo se convierta en: $y_{it} = \mu_i + \sum_j \pi_{ij} \theta_{jt} + \epsilon_{it}$ . $j$ indica el grupo $1,2,...,J$ . $\pi_{ij}$ es la probabilidad de que el individuo $i$ está en el grupo $j$ . $\theta_{jt}$ es el efecto temporal para el grupo $j$ a la vez $t$ .
En mi aplicación particular, $\{\pi_{ij}\}$ debe ser un conjunto de parámetros adicionales. Sin embargo, puedo ver que en otras aplicaciones, podría ser modelado como una función de algunas covariables.
¿Es este modelo un buen enfoque? ¿Lo ha probado alguien antes? ¿Cómo puedo estimar este modelo? El modelo tiene muchos parámetros. He intentado una optimización básica y no ha funcionado. Idealmente, estoy buscando un software para hacer la estimación, como un paquete en R; o, una referencia sólida que podría utilizar para programar esto.
Si el modelo que he propuesto no es un buen planteamiento, ¿de qué otra forma podría resolver este problema? Una posibilidad que se me ocurre es averiguar primero qué individuo pertenece a cada conglomerado y, a continuación, estimar un modelo de efectos fijos normal para cada conglomerado. La cuestión entonces es cómo realizar la clasificación de los datos. Sea cual sea el enfoque, sigo buscando un programa informático o una buena referencia.