6 votos

Qué hacer cuando una variable independiente no es significativo, pero sin duda debe ser!

Agradecería su ayuda con este problema. Estoy tratando de replicar este estudio que trata de encontrar el nivel óptimo de capital del banco. Todo esto se hace con el programa Stata. La única diferencia es que tengo los datos trimestrales, y los autores de semi-anual de los datos.

Tenemos un problema con la siguiente regresión:

Beta=alpha(i) + X(i,t-1)b + u(it)

X(i,t-1) representa un muy documentado importante predictor de la beta. El proceso de estimación es la siguiente:

  1. Realizar una unidad de la raíz de la prueba para asegurarse de beta y X no tienen un falso enlace.

    Se realizó la prueba y rechazamos la H0, por lo tanto, todo bien hasta aquí.

  2. Realizar la regresión mediante OLS, Efectos Fijos y Efectos Aleatorios. Al correr las regresiones, seguir todos los pasos indicados en el estudio, obtenemos que X no es significativo. Ni siquiera en el 80% de nivel! Para cualquiera de los tres métodos. (Por favor vea desde el final de la página 13 página 15 para obtener más detalles acerca de la regresión).

Nuestro panel de datos se ve algo como esto:

Panel data

De acuerdo a lo indicado en el papel, esta es la regresión podemos ejecutar:

. xtset bank quarters, quarterly

panel variable:  bank (strongly balanced)
time variable:  quarters, 1998q1 to 2013q1
delta:  1 quarter

--

. xtreg beta ib(first).year LD.leveragefull, fe vce(cluster bank)

Y esto es lo que obtenemos:

    Fixed-effects (within) regression               Number of obs      =       295
Group variable: bank                            Number of groups   =         5

R-sq:  within  = 0.2965                         Obs per group: min =        59
       between = 0.0002                                        avg =      59.0
       overall = 0.1387                                        max =        59

                                                F(4,4)             =         .
corr(u_i, Xb)  = 0.0000                         Prob > F           =         .

                                   (Std. Err. adjusted for 5 clusters in bank)
------------------------------------------------------------------------------
             |               Robust
        beta |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        year |
       1999  |  -.2352546   .0679795    -3.46   0.026    -.4239961   -.0465131
       2000  |  -.3410705   .1256874    -2.71   0.053    -.6900346    .0078936
       2001  |  -.2187538   .1399625    -1.56   0.193    -.6073519    .1698443
       2002  |  -.2628397    .094347    -2.79   0.050     -.524789   -.0008903
       2003  |  -.1413272    .050201    -2.82   0.048    -.2807076   -.0019469
       2004  |  -.2506764   .0697621    -3.59   0.023     -.444367   -.0569858
       2005  |  -.3280419   .1220112    -2.69   0.055    -.6667993    .0107156
       2006  |  -.2976486   .0996758    -2.99   0.040     -.574393   -.0209043
       2007  |  -.1901107   .1236727    -1.54   0.199    -.5334811    .1532598
       2008  |  -.1407684   .0840705    -1.67   0.169    -.3741854    .0926487
       2009  |  -.0503666   .0505586    -1.00   0.376    -.1907398    .0900066
       2010  |  -.0764699    .057999    -1.32   0.258    -.2375011    .0845613
       2011  |  -.0035166   .0720702    -0.05   0.963    -.2036155    .1965823
       2012  |   .0006204   .0492506     0.01   0.991     -.136121    .1373619
       2013  |   .3996657   .0604211     6.61   0.003     .2319099    .5674215
             |
leveragefull |
         LD. |   .0047472   .0068057     0.70   0.524    -.0141484    .0236428
             |
       _cons |   .5461694    .069342     7.88   0.001     .3536452    .7386935
-------------+----------------------------------------------------------------
     sigma_u |  .29632318
     sigma_e |  .21633914
         rho |   .6523096   (fraction of variance due to u_i)
------------------------------------------------------------------------------

Los autores del estudio, por otro lado, conseguir muy significativas en los valores de leveragefull (X), y esto hace sentido absoluto con la teoría y la práctica.

Así que la pregunta es, ¿qué estoy haciendo mal? ¿Cuál puede ser el problema? Cómo puedo solucionar cualquiera de los datos o la regresión con el fin de aumentar la importancia de los resultados?

4voto

Jared Farrish Puntos 120

Una cosa que usted puede hacer es mirar en los tamaños del efecto y construir un intervalo de confianza alrededor de ellos. "Muy" coeficientes significativos no necesariamente representan fuertes efectos y resultados de la prueba dependerá en gran medida el tamaño de la muestra. Por lo tanto, una falla en rechazar la hipótesis nula no es, como tal evidencia de que sus resultados no son consistentes con el estudio anterior (Andrew Gelman regularmente pone de esa manera: "la diferencia entre lo significativo y no significativo en sí mismo no es significativo").

Básicamente, el más datos, más confianza se puede tener en el hecho de que el coeficiente es diferente de 0, pero, de nuevo, que no es una medida de la fuerza de la relación entre las variables. Si los intervalos de confianza se superponen o el coeficiente o el tamaño del efecto de las medidas son similares, pero uno no es significativo, simplemente significa que uno de los estudios tenían menos poder. Si ese es el caso, una forma de "arreglar" es simplemente para recoger más datos.

También, yo no sé nada de su campo y no estoy seguro de seguir exactamente lo que están haciendo, pero en general se habla de uno de los estudios publicados, no sería suficiente para convencerme de que algo definitivamente debe ser significativo, no importa cuál sea la pertinente p valor era. Si usted tiene fuertes razones teóricas para esperar que esa es otra historia, pero no se debe sobreestimar la reproducibilidad de muchos de los resultados publicados (véase, por ejemplo, John ioannidis, académico e investigador de publicaciones).

1voto

Mark Lindell Puntos 637

Después de leer más, me enteré de que los valores no son significativos debido a que el modelo de efectos fijos no funciona bien con los datos. Tengo un alto heterskedasticity, que no es fijado por la transformación de los datos en su forma de registro. Hasta ahora, la MCO con Errores Robusto de ajuste para la heterocedasticidad es lo que nos está dando los mejores resultados.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X