4 votos

Modelo de selección dirigido a hacer "inadaptado" estadísticamente insignificante

Estoy trabajando con un modelo que puede ser descrito aproximadamente como

$$ \left\{ \begin{array}{ll} y^* & = & \beta_0 + x'\beta + \epsilon_{\{x,v\} } \\ w^* & = & \gamma_0 + v'\gamma + \delta_{\{x,v\} } \\ y & = & 1[y^* >0 ] \\ w & = & 1[w^* >0 ] \end{array} \right. $$ a pesar de que uno o el otro de $y$ o $w$ puede ser ordinal. (Yo soy la instalación de este en términos genéricos con Stata cmp paquete por Roodman (2011).)

Cuando los conjuntos de regresores $x$ $v$ están vacías, $y^*$ $w^*$ están fuertemente correlacionados. (y por lo tanto son sus versiones discretas $y$$w$). Es esta correlación que tengo el propósito de mi modelo de selección: necesito hacer es pequeño, lo que sé que puedo hacer que suceda, ya que hay común influye en $y$ $w$ a partir de las variables explicativas $x$ $v$ (que me quedé distintos en mi notación, pero es probable que tenga un montón de variables comunes en la práctica).

Mis preguntas son:

  1. ¿Cuáles son las formas para llevar a cabo la elección de los modelos aquí? Hasta el momento, estoy usando un codicioso algoritmo de búsqueda que añade una variable a la vez a $x$ y/o $v$, comprobar cómo la magnitud (o, mejor, la significación) de la $\epsilon$-$\delta$ la corrección se ve afectada, y se elige la variable que proporciona la mejor mejora.
  2. ¿Debo preocuparme por la exclusión de variables necesarias para la identificación? (Un poco más, y de una forma más precisa, la historia es que el $y$ ecuación es una ecuación de selección, y $w$ ecuación es la respuesta de la ecuación que sólo se aplica a los casos con $y=1$, en una variación del modelo de Heckman. Si la selección de la realidad, depende de $w$, como está implícito en la oferta de mano de obra modelo utilizado por Heckman, nadie lo dice, pero no tiene que ser, en el contexto de mi aplicación).
  3. ¿Qué otras preguntas que debería hacer?

Algo parecido problema de la modificación de su modelo hasta una cierta prueba estadística se convierte en insignificante se enfrenta en el modelado de ecuaciones estructurales, y no creo que haya una respuesta que me iba a encontrar satisfactoria.

2voto

Jeff Bauer Puntos 236

Voy a proponer un método, basado en la suposición de que los regresores de la matriz será idéntico para ambas ecuaciones, se $Z$. Entonces : ¿qué buscáis? Para "quitar la correlación" entre el $y$ $w$ porque cree que se trata de los regresores. ¿Cómo se sabe? Como lo que yo puedo decir, usted tendrá que considerar "lo que queda inexplicable" de las dos variables dependientes después de la regresión de ellos en $Z$, y comprobar si estos dos "inexplicable"s se han convertido en la no correlación. Estos dos "inexplicable"s son los residuos de las dos regresiones. Idealmente, usted quiere que ellos sean totalmente correlacionadas, yo.e para obtener $$\text{Corr}(\hat \epsilon, \hat \delta) = 0 \Rightarrow \text{Cov}(\hat \epsilon, \hat \delta) = 0 \Rightarrow E (\hat \epsilon \hat \delta) - E (\hat \epsilon )E (\hat \delta) = 0$$ Como los residuos, los que tendrán por la construcción de cero significa. Así que se quedan con el objetivo ideal de

$$E (\hat \epsilon \hat \delta) = 0$$ es decir, que los dos residual de la serie son ortogonales. Este es un momento de condición, y usted puede minimizar su muestra analógica, es decir,

$$\min \frac 1n |\sum_i\hat \epsilon_i \hat \delta_i| = min \frac 1n |\mathbf {\hat \epsilon'}\mathbf {\hat \delta}|$$

donde el primer denots un vector fila. Ahora denotar $M_z = I-Z(Z'Z)^{-1}Z'$ "annihilator" o "residual maker" $n\times n$ matriz. Lo segundo nombre viene del hecho de $M_z\mathbf y = \mathbf {\hat \epsilon}$. This matrix is symmetric and idempotent, $M_z' = M_z,\; M_zM_z = M_z$. A continuación, puede escribir la función objetivo como

$$\min \frac 1n |(M_z\mathbf y)' (M_z\mathbf w)| =\min \frac 1n |\mathbf y' M_z'M_z\mathbf w| =\min \frac 1n|\mathbf y' M_z\mathbf w| $$

Minimizar en el conjunto de regresores de curso. Así que usted establezca una rutina para evaluar este producto a través de diversas combinaciones de los regresores. La combinación que le da el menor valor de la función objetivo es el que hará de sus dos variables dependientes como no correlacionados como sea posible, después de eliminar el efecto de dicho regresores.

Para su rutina, tenga en cuenta que el objetivo de la función es equivalente a la del producto interior residual de una regresion veces la otra variable dependiente

$$\mathbf y' M_z\mathbf w = \mathbf y'\mathbf {\hat \delta} = \mathbf {\hat \epsilon'}\mathbf w$$

ADEMÁS: Si desea reducir directamente el (valor absoluto) el coeficiente de correlación entre las dos residual de la serie, usted tendrá que tomar en cuenta las estimaciones de las desviaciones estándar también. En tal caso, su función objetivo se convierte en

$$\min |\mathbf y' M_z\mathbf w|\left(\mathbf y' M_z\mathbf y\mathbf w' M_z\mathbf w\right)^{-\frac 12}$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X