1 votos

Advertencia: la matriz de varianza no es simétrica o altamente singular

Recibo la advertencia anterior al ejecutar una regresión 2SLS en Stata con errores estándar robustos. Específicamente, obtengo esto para la primera etapa, donde además la primera etapa no tiene estadísticas F, valor p, errores estándar, valores t o intervalo de confianza.

Para dar más contexto, mi instrumento es la asignación aleatoria del tratamiento mientras que mi variable endógena es si el sujeto cumplió con el tratamiento (es decir, completó el tratamiento previsto). ¿Cuál podría ser la causa de esto? ¿Hay un problema fundamental con el uso del tratamiento asignado como instrumento? ¿Hay un método más elaborado para obtener el Efecto Causal Promedio del Cumplidor?

1voto

Christoph Hanck Puntos 4143

¿Es la cumplimiento perfecto, es decir, que todo aquel a quien se le dice que reciba tratamiento lo hace y todo aquel a quien se le dice que no lo haga no lo hace, de modo que la primera etapa tenga un ajuste perfecto? Con cero residuos en la primera etapa, entonces tampoco se pueden calcular estadísticas t o F, etc.

Por cierto, entonces también tenemos 2SLS = OLS, y de todos modos, un enfoque 2SLS parece redundante bajo un cumplimiento perfecto, ya que está diseñado para manejar las consecuencias de un cumplimiento no perfecto. Bajo un cumplimiento perfecto, OLS está bien.

Este argumento y el ejemplo anterior también demuestran que el problema parece no estar relacionado con errores robustos.

Ejemplo:

library(ivmodel)
n <- 100
Z <- sample(c(0,1), n, replace=T)
X <- Z
y <- rnorm(n)
> summary(lm(y~X))

Llamada:
lm(formula = y ~ X)

Residuos:
     Min       1Q   Mediana       3Q      Máx 
-2.14902 -0.90276  0.00966  0.80308  2.97005 

Coeficientes:
            Estimado Error estándar valor t valorP
(Intercepto)  -0.1935     0.1626  -1.191    0.237
X             0.2280     0.2254   1.011    0.314

Error estándar residual: 1.126 con 98 grados de libertad
R cuadrado múltiple:  0.01033,   R cuadrado ajustado:  0.0002302 
Estadístico F: 1.023 con 1 y 98 grados de libertad,  valor p: 0.3143

> ivmodel(y, X, Z)

Llamada:
ivmodel(Y = y, D = X, Z = Z)
tamaño de la muestra: 100
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 

Resultado de la Regresión de la Primera Etapa:

F=-3.825057e+16, df1=1, df2=98, valor p es 1
R-cuadrado=1,   R-cuadrado ajustado=1
Error estándar residual: NaN con 99 grados de libertad
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 

Coeficientes de Estimadores de Clase k:

               k  Estimado Error estándar valor t valorP
OLS    0.000e+00 2.280e-01  2.254e-01   1.011    0.314
TSLS   1.000e+00 2.280e-01  2.254e-01   1.011    0.314
Fuller 7.037e+13 2.392e-01  2.254e-01   1.061    0.291
LIML   7.037e+13 2.392e-01  2.254e-01   1.061    0.291
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 

Pruebas alternativas para el efecto del tratamiento bajo H_0: beta=0.

Prueba de Anderson-Rubin (bajo distribución F):
F=1.022796, df1=1, df2=98, valor p es 0.31435
Intervalo de confianza del 95 por ciento:
 [-0.219390069608376, 0.675394290189136]

Prueba de Razón de Verosimilitud Condicional (bajo aproximación normal):
Estadístico de prueba=0, valor p es 1
Intervalo de confianza del 95 por ciento:
 [NA, NA]
Mensaje de advertencia:
En sqrt(SSE/DE) : Se produjeron NaNs

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X