Estoy intentando estimar errores estándar robustos en una regresión de datos de panel. Entiendo las regresiones de datos de panel conceptualmente, pero R ofrece un montón de opciones de las que no estoy seguro. Mis datos tienen el siguiente formato:
id time name y x1 x2
1 10 A 1.28233854 -0.42411039 1.89640596
1 11 A -0.59541995 -0.43214374 0.07386285
1 12 A 0.88951720 -1.55417836 0.28276157
2 10 B 1.11211744 -0.89200195 0.88989664
2 11 B -0.37737953 0.09055494 1.20764357
3 10 C 0.03258314 -0.13834344 -0.97812765
3 11 C -0.97645525 -0.14313482 -1.03528695
3 12 C -0.02031554 0.02061293 -0.71353867
Aquí está el código R para crear los datos:
x <- data.frame(id = rep(c(1, 2, 3), c(3,2,3)), time = c(10,11,12,10,11,10,11,12),name= rep(c("A", "B", "C"), c(3,2,3)), y = rnorm(8), x1 = rnorm(8), x2 = rnorm(8))
Para realizar la regresión y los errores estándar robustos, utilizo
library(plm)
library(sandwich)
library(lmtest)
attach(x)
# Pooling:
r1 <- plm(y ~ x1 + x2, model="pooling", x, index = c("id","time"))
r1
coeftest(r1,vcov=vcovHC(r1,type="HC0",cluster="group"))
# Fixed effects:
r2 <- plm(y ~ x1 + x2, model="within", x, index = c("id","time"))
r2
coeftest(r2,vcov=vcovHC(r2,type="HC0",cluster="group"))
detach(x)
Mis preguntas son las siguientes:
1) ¿Es correcto agrupar por grupos en el modelo de agrupación y en el modelo de efectos fijos? También podría agrupar por tiempo. Mi problema es que en el modelo de efectos fijos sólo tenemos en cuenta la variación interna a lo largo del tiempo, por lo que, según tengo entendido, no tendría ningún sentido agrupar los errores estándar por grupo con este enfoque.
2) Hay 3 opciones para elegir un efecto, "individual", "tiempo" o "dos vías". Pero no he podido encontrar una buena explicación de qué efecto utilizar en cada modelo. Tal vez alguien podría decirme qué efecto utilizar en el modelo simple anterior, ya sea en el modelo interno o en el de agrupación.