2 votos

¿Sería razonable intentar utilizar una puntuación de propensión como variable instrumental?

¿Sería válida una puntuación de propensión como variable instrumental en un contexto cuasi experimental? He visto artículos que exploran la cuestión desde la dirección opuesta: ¿puede utilizarse una variable instrumental en el cálculo de las puntuaciones de propensión? Gracias.

4voto

metaleap Puntos 121

No.

Digamos que tenemos un tratamiento $T$ Resultado $Y$ y algunas otras variables $X$ . La puntuación de propensión se define entonces como

$$p(x) = P(T = 1|X = x)$$

Se trata, ante todo, de una construcción puramente estadística que no tiene ninguna relación directa con la causalidad. La causalidad entra en escena si suponga que "ignorabilidad":

$$P(Y_{t}|T, X) = P(Y_{t}|X)$$

donde $Y_{t}$ es el resultado potencial de $Y$ cuando $T$ se ajusta a $t$ . Esto es así, por ejemplo, cuando el criterio de la puerta trasera se cumple en el gráfico causal que se supone (es decir, $X$ bloquea todas las vías de entrada de $T$ a $Y$ ).

Rubin y Rosenbaum argumentaron que entonces sostendrá que

$$P(Y_{t}|T, p(X)) = P(Y_{t}|p(X))$$

lo que facilita la estimación al no tener que lidiar con la potencialmente alta dimensión $X$ sino simplemente $p(x)$ que es un número único.

Para el análisis de variables instrumentales, se busca un $X$ tal que, como mínimo, sostiene que ("independencia del instrumento") $$P(Y_{t}|X) = P(Y_{t})$$

(normalmente, se asume más, pero vamos a ignorar esto). Sin embargo, normalmente, $X$ que cumplen el supuesto de "ignorabilidad" anterior contiene variables que influyen tanto en $T$ y $Y$ . Influyendo en $Y$ violaría la independencia de los instrumentos. Dado que la puntuación de propensión es simplemente una función de estos $X$ También violarán la independencia de los instrumentos.

Literatura: Pearl, Judea: Understanding propensity scores. En: Causality, 2nd ed. CUP.

0voto

Chris Komuves Puntos 11

3 preguntas a las que hay que prestar atención cuando se utiliza la puntuación de propensión (PS) como covariable en el modelo de regresión. En la práctica, el PS se obtiene de la regresión logística. Por ejemplo: el modelo lineal.

1: $Y=\beta_0 + \beta_1 T + \beta_2P +\epsilon$ donde $T$ es el tratamiento y $P$ es PS. Porque $P=\frac {\exp(X\beta)}{1+\exp(X\beta)}$ tenemos $Y=\beta_0 + \beta_1 T + \beta_2\frac {\exp(X\beta)}{1+\exp(X\beta)} +\epsilon$ . La pregunta es: ¿Por qué la variable de respuesta $Y$ tiene esta extraña relación con la covariable $X$ ? ¿Por qué necesitamos esta limitación?

2: ¿Debemos considerar la varianza de $P$ porque $P$ se estima a partir de los datos, no se observa el valor real?

3: Si $X$ tiene un problema de alta dimensionalidad y/o colinealidad cuando el $X$ se utiliza en el modelo lineal directamente, $X$ tiene un problema de alta dimensionalidad y/o colinealidad en la regresión logística cuando intenta obtener PS. ¿Es posible resolver este problema en la regresión logística?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X