6 votos

Errores estándar agrupados - ¿Por qué los SE son más pequeños o más grandes que los OLS dependiendo del nivel de cluster?

Estoy analizando algunos datos utilizando un modelo OLS. Los datos representan a los directivos que trabajan en ciudades de Estados Unidos. Dentro de cada ciudad, encuestamos a más de un gerente (máximo 5). Se encuestaron varias ciudades por estado.

Me gustaría utilizar errores estándar agrupados para tener en cuenta posibles agrupaciones a nivel de ciudad o de estado (las políticas estatales podrían ser relevantes en nuestro estudio). Algunos investigadores (p. ej, Cameron y Miller, 2015 ) sugieren la agrupación al más alto nivel (el nivel estatal, en mi caso). Como comprobación, he intentado estimar la SE agrupada en ambos niveles y:

  1. Cuando utilizo el SE agrupado a nivel de ciudad, los errores estándar son ligeramente mayores, pero en general son muy similares a los resultados del MCO.
  2. Cuando utilizo el SE agrupado a nivel estatal, los errores estándar se hacen mucho más pequeños, lo que lleva a resultados muy diferentes a los del modelo OLS.

¿Cuáles son las posibles razones de estas diferencias? ¿Qué estimaciones debo tener en cuenta? El hecho de que los errores estándar cambien más cuando miro a nivel estatal, ¿sería una sugerencia de que la agrupación a nivel estatal es más importante?

Mi muestra contiene 2.250 observaciones, agrupadas en 487 ciudades (tamaño medio de los conglomerados = 4, pero algunos tamaños de conglomerados = 1) y 49 estados (tamaño medio de los conglomerados = 30).

0 votos

Bien, entonces la siguiente pregunta es, si la agrupación cambia el tamaño de la SE, digamos que la hace más pequeña, ¿es un problema porque crea dependencia del modelo?

3voto

user219012 Puntos 1

Lo que se observa puede explicarse por las correlaciones en las mediciones dentro de las agrupaciones. En concreto, cuando se selecciona un análisis, como el OLS, que no tiene en cuenta estas correlaciones, se espera que los errores estándar de los efectos dentro de los conglomerados estén sobreestimados, y que los errores estándar de los efectos entre los conglomerados estén subestimados.

2voto

Neal Puntos 316

La ecuación de la inflación de la varianza (6) en la página seis (ajustada por el tamaño desigual de los conglomerados más abajo) en el documento de Cameron y Miller que enlazaste contiene la intuición. Si tiene una correlación positiva en el regresor de interés o en los errores dentro de ciudades (los dos $\rho$ s), pero una correlación negativa dentro de estados Eso podría explicar el patrón de lo que está viendo. Esto podría ser amplificado por el tamaño desigual de la agrupación multiplicando el $\rho$ s en los dos niveles de agrupación. Puede estimarlas para confirmarlo.

No proporcionas ningún detalle de tu entorno, por lo que es difícil dar un ejemplo de cómo podría ocurrir esto en tu caso. Un ejemplo es si tiene un patrón de migración de las zonas rurales a las urbanas en sus datos impulsado por los auges locales. En ese caso, todas las observaciones de las ciudades podrían tener residuos positivos correlacionados positivamente, lo que reflejaría el auge, y las zonas rurales tendrían residuos negativos correlacionados positivamente debido a las crisis, pero dentro de los estados, los residuos de las observaciones rurales estarían correlacionados negativamente con los urbanos si los emigrantes se desplazan dentro del estado. Hay otro ejemplo aquí con más explicaciones.

Además, siempre que sea posible, hay que utilizar clústeres más grandes y más agregados, hasta el punto en el que se teme tener muy pocos clústeres. En otras palabras, definitivamente no se quiere agrupar siempre al nivel más alto (por ejemplo, las cuatro regiones censales de EE.UU.). Por desgracia, no existe una definición clara de "demasiado pocos", pero menos de 50 es cuando la gente empieza a preocuparse.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X