3 votos

Regresión en dos pasos con efectos de grupo y DAG

Considere el siguiente modelo

$$y_i = \sigma_{c(i)} + \mathbf x_i^\top\beta + u^y_i $$ $$\sigma_{c} = z_c\lambda + \eta_c$$

donde para todos $i$

$$\mathbb E[u^y_i \lvert x_i] = 0$$

Los datos se refieren a una muestra aleatoria $\{y_i,\mathbf x_i,z_{c(i)}\}_{i=1}^N$ dejando $u^y_i, \sigma_c, \eta_c,\lambda$ y $\beta$ no se ha observado.

Intuitivamente, el modelo puede interpretarse como un modelo de dos niveles en el que $i$ es un trabajador observado que recibe un salario $y_i$ en la ciudad $c$ y $z_c$ son covariables observadas a nivel de ciudad mientras que $\eta_c$ son factores no observados específicos de la ciudad que afectan al salario de forma aditiva a través de $\sigma_c$ . La función $c(i)$ simplemente connota la ciudad donde el individuo $i$ funciona.

Es evidente que la estimación de la primera ecuación puede llevarse a cabo utilizando variables ficticias específicas de la ciudad, lo que daría lugar a una estimación $\hat \sigma_c$ para cada ciudad (tengo muchas observaciones para cada ciudad/grupo, así que supongo que esto está bien). Entonces, para estimar $\lambda$ la segunda etapa de regresión

$$\hat \sigma_c = z_c \lambda + \eta_c$$

se realiza. ¿Puede justificarse este enfoque (dar una estimación coherente de $\lambda$ ) cuando

$$\mathbb E[\eta_c \lvert z_c] = 0$$

pero

$$\mathbb E[\eta_c \lvert \mathbf x_i] \not = 0,$$

quizás considerando el DAG del modelo que creo que podría ser algo así enter image description here

que debe ser implementado en el siguiente código, que creo que muestra que el enfoque funciona. Pero no estoy seguro de cómo demostrarlo utilizando, por ejemplo, argumentos de la autoría de Pearl en los DAG o cualquier otro argumento dados los supuestos.

library(data.table)
library(lfe)

N <- 100000
C <- 300

# Make index over what cities individual worker are in
city_index <- sample(1:C,N,replace=TRUE)

# Make unobserved city productivity effect eta and observed z
eta <- 6*runif(C)
z <- 2*runif(C)
# Calculate city level effect
a <- 1
c_i <- z[city_index]*a + eta[city_index]

# Simulate worker specific skill x
u_x <- rnorm(N)
x <- u_x + c_i 
b <- 2
u_y <- rnorm(N)
# Simulate wages
y <- c_i + x*b + u_y

mydata <- data.table(wage=y,city=city_index,skill=x,city_chr=z[city_index])
model_1 <- felm(wage ~ skill + city_chr,data=mydata)
model_2 <- felm(wage ~ skill - 1|city,data=mydata)
model_1
model_2

city_data <- data.table(getfe(model_2))[,.(idx,effect)]
city_data$city_chr <- z

lm(effect ~ city_chr,data=city_data)
plot(city_data$effect[city_index],c_i)

2voto

joelsand Puntos 717

En cuanto a la inferencia de causalidad de tipo Pearl, sería bueno evaluar la literatura sobre el sesgo de colisión o el sesgo de selección endógena. En general, la estimación de $\sigma$ podría estar sesgada y, por tanto, la estimación de $\lambda$ no produciría su coeficiente de interés.

Porque estás controlando por $X$ se induce una correlación entre su estimación para $\sigma$ y $u_x$ aunque ambos no estén directamente correlacionados. El sesgo del colisionador es notoriamente poco intuitivo, pero se puede evaluar este documento para una bonita ilustración.

El escenario de este trabajo es uno en el que estamos interesados en el efecto del tabaquismo sobre la mortalidad neonatal, se podría controlar el peso del niño al nacer para abordar otros posibles factores que afectan a la mortalidad neonatal (muy razonable a primera vista). Sin embargo, dado que el tabaquismo (RF) podría afectar también al peso al nacer (BWT), se induce un escenario en el que, al condicionar el BWT, se crea una posible relación negativa entre el RF y el U no servido. Esto podría generar una situación en la que un bebé con un BWT relativamente bajo pero con una madre fumadora tendría en realidad un riesgo menor que el mismo bebé con un BWT bajo pero con una madre no fumadora, porque el BWT bajo procede del U que tiene un riesgo directo aún mayor ( $b$ ) de afectar a la mortalidad neonatal. Esto se ha propuesto como explicación de la paradoja del peso al nacer .

from Whitcomb BW, Schisterman EF, Perkins NJ, Platt RW. Quantification of collider-stratification bias and the birthweight paradox. Paediatr Perinat Epidemiol. 2009;23(5):394–402. doi:10.1111/j.1365-3016.2009.01053.x

En su caso, al condicionar en $X$ se correría el riesgo de una posible relación similar entre $\sigma$ y $U$ que afectaría a la estimación de $\sigma$ y por lo tanto invalidan la inferencia para $\lambda$ . Obsérvese que el sesgo del colisionador puede ser (muy) pequeño, aunque hay numerosos casos en los que los signos se invierten como resultado.

Véase también un debate accesible:

Elwert, Felix, y Christopher Winship. "Sesgo de selección endógena: El problema de condicionar una variable de colisión". Annual review of sociology 40 (2014): 31-53.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X