4 votos

Efectos fijos del modelo mixto

Un modelo estándar utilizado con datos de panel es el de efectos fijos: $y_{it} = \mu_i + \theta_t + \epsilon_{it}$ donde $i$ es el individuo y $t$ son subíndices temporales. Esto puede estimarse fácilmente con MCO y variables ficticias.

El modelo supone que existe una única serie temporal subyacente, $\theta_t$ para $t = 1,2,...,T$ . Se supone que todos los individuos de los datos siguen esta serie temporal más algún efecto individual, que es constante en relación con el tiempo.

Supongamos, sin embargo, que hay dos o más grupos de individuos, que cada grupo tiene su propia serie temporal y que, antes de mirar los datos, no sabemos quién está en cada grupo. Me gustaría estimar el modelo de efectos fijos en este caso y averiguar qué individuo está en qué grupo / cluster .

El planteamiento que se me ha ocurrido es que el modelo se convierta en: $y_{it} = \mu_i + \sum_j \pi_{ij} \theta_{jt} + \epsilon_{it}$ . $j$ indica el grupo $1,2,...,J$ . $\pi_{ij}$ es la probabilidad de que el individuo $i$ está en el grupo $j$ . $\theta_{jt}$ es el efecto temporal para el grupo $j$ a la vez $t$ .

En mi aplicación particular, $\{\pi_{ij}\}$ debe ser un conjunto de parámetros adicionales. Sin embargo, puedo ver que en otras aplicaciones, podría ser modelado como una función de algunas covariables.

¿Es este modelo un buen enfoque? ¿Lo ha probado alguien antes? ¿Cómo puedo estimar este modelo? El modelo tiene muchos parámetros. He intentado una optimización básica y no ha funcionado. Idealmente, estoy buscando un software para hacer la estimación, como un paquete en R; o, una referencia sólida que podría utilizar para programar esto.

Si el modelo que he propuesto no es un buen planteamiento, ¿de qué otra forma podría resolver este problema? Una posibilidad que se me ocurre es averiguar primero qué individuo pertenece a cada conglomerado y, a continuación, estimar un modelo de efectos fijos normal para cada conglomerado. La cuestión entonces es cómo realizar la clasificación de los datos. Sea cual sea el enfoque, sigo buscando un programa informático o una buena referencia.

4voto

John with waffle Puntos 3472

Usted está tratando de ajustar un "modelo de mezcla", aunque yo sugeriría no tener un conjunto separado de $\pi_{ij}$ para cada persona, sino modelizar estas probabilidades como una función (es decir, logística) de algunas covariables. Incluso se podría empezar con una constante $\pi_j$ . El enfoque típico para ajustar modelos de mezcla es el algoritmo EM (maximización de expectativas), aunque para las versiones más sencillas funcionaría incluso la maximización directa.

Tal vez la búsqueda con estos términos le ayude a encontrar una solución que ya existe.

2voto

StasK Puntos 19497

Este tipo de modelo lleva años entretenido por los investigadores de la educación bajo el nombre de modelo de crecimiento mixto (¿los distintos alumnos muestran un ritmo de aprendizaje diferente?), aunque trabajan con él como un modelo de efectos aleatorios. No creo que se pueda llegar a una estimación de efectos fijos adecuada para este modelo, ya que puede carecer de la estadística suficiente sobre la que se podría condicionar. Pero un modelo ML completo no debería ser extremadamente difícil de ajustar.

En Stata, puede intentar fmm con un conjunto completo de dummies id de panel y/o interacciones con el tiempo, aunque este es un enfoque muy derrochador en términos de grados de libertad.

1voto

JohnRos Puntos 3211

Sospecho que en realidad quieres decir $y_{it}=μ_i+∑_j I_{ij}θ_{jt}+ϵ_{it}$ donde $I_{ij}$ es un indicador del individuo $i$ pertenencia al grupo $j$ (con probabilidad $\pi_{ij}$ . También me pregunto si realmente quiere permitir que diferentes individuos tengan diferentes probabilidades de asignación de grupo. Sospecho que $\pi_j$ ¿será suficiente?

Supongo que podría considerarse un efecto aleatorio/mixto (no una mezcla) con un efecto multinomial. Puede que sea un término inadecuado, ya que "efectos aleatorios" se suele utilizar para referirse a los efectos aleatorios gaussianos.

También hay que tener en cuenta que no se trata de una mezcla gaussiana, porque se permite un desplazamiento individual de la gaussiana ( $\mu_i$ ).

En cualquier caso, se me ocurren dos enfoques:

  1. Escribe la probabilidad y maximízala usando un algoritmo EM que puedes escribir tú mismo.
  2. Compute $\mu_i$ promediando dentro de los individuos (suponiendo que se dispone de suficientes observaciones). Los residuos se distribuirán como una mezcla gaussiana de localización en cada $t$ . Puede utilizar una implementación estándar de EM como mixtools Paquete R para estimar $\{\theta_{jt}\}$ y $\{\pi_j\}$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X