4 votos

¿Por qué no los resultados de la regresión cambio después de bootstrap?

Aprendí bootstrap se utiliza para tratar la no-normalidad de los residuales y que básicamente hace de remuestreo.

Hice arranque en Stata y compara el resultado con la normal de la regresión.

 reg salary salbegin educ, vce(bootstrap, reps(1000))
------------------------------------------------------------------------------
             |   Observed   Bootstrap                         Normal-based
      salary |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    salbegin |   1.672631   .0962783    17.37   0.000     1.483928    1.861333
        educ |    1020.39   164.8032     6.19   0.000     697.3818    1343.398
       _cons |  -7808.714   1582.694    -4.93   0.000    -10910.74   -4706.692
------------------------------------------------------------------------------


 reg salary salbegin educ
------------------------------------------------------------------------------
      salary |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    salbegin |   1.672631    .058847    28.42   0.000     1.556995    1.788266
        educ |    1020.39   160.5504     6.36   0.000     704.9064    1335.874
       _cons |  -7808.714    1753.86    -4.45   0.000    -11255.07   -4362.355
------------------------------------------------------------------------------

Sorprendentemente, el coeficiente p-valor no parecen cambiar. Si bootstrap hace remuestreo, ¿por qué no regresión resultado del cambio? ¿Qué es bootstrap haciendo en realidad? Simplemente tiene que corregir el error estándar?

10voto

Andy Puntos 10250

En realidad, el p-valor de cambio, pero dado que se redondea hacia abajo a 0.000 en el primer lugar que no fuera capaz de ver la diferencia. El bootstrap es utilizado principalmente para la estadística de prueba en lugar de los coeficientes de regresión. Para una ligera introducción, eche un vistazo a la Wikipedia en el arranque o para un tratamiento más exhaustivo ver Horowitz (2001). También si usted escriba help bootstrap en Stata puede hacer clic en [R] bootstrap en la parte superior izquierda del archivo de ayuda que se abrirá el manual de Stata que muy bien los documentos de los archivos de inicio (bajo el epígrafe "observaciones y ejemplos").

En segundo lugar, se han especificado las bootstrap en la vce (varianza-covarianza del estimador). Con esto se ordenó de Stata para bootstrap sus errores estándar, y nada más - que fue la menor explicación técnica a su observación de que los coeficientes no cambian.

Cuando se llama a esta opción, el programa Stata tarda $k$ bootstrap muestras ($k = 1000$ en su caso) de los datos originales. A continuación, se utiliza la fórmula $$\widehat{se} = \left( \frac{1}{k-1} \sum_{i=1}^{k} (\widehat{\beta}_i - \overline{\beta})^2 \right)^{\frac{1}{2}} $$ para calcular el error estándar donde: $\widehat{\beta}_i$ es su coeficiente de estimación de cada uno de bootstrap de la muestra y $$\overline{\beta} = \frac{1}{k}\sum_{i=1}^{k}\widehat{\beta}_i$$ es el promedio de las $k$ bootstrap estimaciones. Así que en lugar de calcular su error estándar analíticamente a través de una fórmula específica (que a veces puede que incluso no disponible), se obtiene la distribución de muestreo de la $\widehat{\beta}$ repetidamente de muestreo de los datos. A partir de la expresión anterior de la norma error que vea que esto es sólo la desviación estándar de esta distribución de muestreo. Por ejemplo, esta distribución de muestreo puede ser algo como esto

enter image description here

para que luego se puede utilizar su error estándar para la inferencia como el 95% de confianza de la región por debajo de la curva y el como. Para la estimación del coeficiente no cambia (lo que he llamado "significa" en el gráfico), pero se puede obtener el error estándar a través de re-muestreo en lugar de calcular de la forma habitual como $\widehat{se}(\widehat{\beta}) = \sqrt{s^2 (X'X)^{-1}}$.

Algunos precaución debe ser utilizada con el bootstrap, ya que es fácil empleamos mal. Por ejemplo, sólo puede proporcionar estimaciones inconsistentes de sus errores estándar cuando sus observaciones están correlacionadas, en cierto sentido, y no independientes (ver de nuevo (Horowitz (2001) para los diferentes supuestos que subyacen en el proceso de arranque). Un buen resumen de este se da también en Cameron y Trivedi (2010) "Microeconometría con Stata".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X