He estudiado los libros de texto estándar de econometría sobre datos de panel, pero la mayoría de los libros de texto sólo mencionan la diferencia entre paneles equilibrados y no equilibrados. No se suele explicar la ventaja de tener datos de panel equilibrados. Me gustaría saber: ¿Cuál es la ventaja de tener un panel equilibrado? Creo que los paneles desequilibrados son mucho más comunes en la investigación real.
Respuestas
¿Demasiados anuncios?Creo que siempre que haya paneles desequilibrados, hay que hacer una descripción formal de por qué es así. Hay que preocuparse por la autoselección, la falta de respuesta y la deserción, especialmente si se está interesado en los parámetros de la población y la coherencia. Para la mayoría de los estimadores, la mecánica es prácticamente la misma.
Creo que se trata en gran medida de razones históricas. En la década de 1940, había que realizar el análisis de la varianza con papel y lápiz, por lo que tener diseños equilibrados conducía a sumas sencillas tanto para las medias como para las varianzas. Cualquier desequilibrio requeriría invertir matrices de 4x4 o más grandes (lo he hecho un par de veces en exámenes de regresión, y casi siempre metí la pata). Es probable que en la década de 1960, cuando los datos de panel/longitudinal llamaron por primera vez la atención de los investigadores (probablemente con el PSID), uno podía ejecutar con razonable facilidad una regresión sin estructura en los errores, pero ejecutar GLS requería esfuerzos heroicos, por no hablar de GLS desequilibrados. Hoy en día, no hay ningún problema, como dijo Dimitriy, ya que todos los estimadores se calculan en la forma general con las operaciones de inversión de la matriz más general en el fondo, de todos modos.
Además, con conjuntos de datos equilibrados, se pueden ejecutar fácilmente modelos con autoregresiones de panel. Con paneles no equilibrados, es probable que sea más difícil. No creo que estos modelos sean tan populares.
Se prefieren los datos equilibrados a los paneles no equilibrados, porque permiten una observación de la misma unidad (por ejemplo, individuo, empresa, persona, etc.) en cada período de tiempo (por ejemplo, año, mes, etc.), lo que reduce el ruido introducido por la heterogeneidad de la unidad (individuo, etc.).