Estoy analizando algunos datos utilizando un modelo OLS. Los datos representan a los directivos que trabajan en ciudades de Estados Unidos. Dentro de cada ciudad, encuestamos a más de un gerente (máximo 5). Se encuestaron varias ciudades por estado.
Me gustaría utilizar errores estándar agrupados para tener en cuenta posibles agrupaciones a nivel de ciudad o de estado (las políticas estatales podrían ser relevantes en nuestro estudio). Algunos investigadores (p. ej, Cameron y Miller, 2015 ) sugieren la agrupación al más alto nivel (el nivel estatal, en mi caso). Como comprobación, he intentado estimar la SE agrupada en ambos niveles y:
- Cuando utilizo el SE agrupado a nivel de ciudad, los errores estándar son ligeramente mayores, pero en general son muy similares a los resultados del MCO.
- Cuando utilizo el SE agrupado a nivel estatal, los errores estándar se hacen mucho más pequeños, lo que lleva a resultados muy diferentes a los del modelo OLS.
¿Cuáles son las posibles razones de estas diferencias? ¿Qué estimaciones debo tener en cuenta? El hecho de que los errores estándar cambien más cuando miro a nivel estatal, ¿sería una sugerencia de que la agrupación a nivel estatal es más importante?
Mi muestra contiene 2.250 observaciones, agrupadas en 487 ciudades (tamaño medio de los conglomerados = 4, pero algunos tamaños de conglomerados = 1) y 49 estados (tamaño medio de los conglomerados = 30).
0 votos
Bien, entonces la siguiente pregunta es, si la agrupación cambia el tamaño de la SE, digamos que la hace más pequeña, ¿es un problema porque crea dependencia del modelo?