Estoy trabajando con un modelo que puede ser descrito aproximadamente como
$$
\left\{ \begin{array}{ll} y^* & = & \beta_0 + x'\beta + \epsilon_{\{x,v\} }
\\ w^* & = & \gamma_0 + v'\gamma + \delta_{\{x,v\} }
\\ y & = & 1[y^* >0 ]
\\ w & = & 1[w^* >0 ]
\end{array} \right.
$$
a pesar de que uno o el otro de $y$ o $w$ puede ser ordinal. (Yo soy la instalación de este en términos genéricos con Stata cmp
paquete por Roodman (2011).)
Cuando los conjuntos de regresores $x$ $v$ están vacías, $y^*$ $w^*$ están fuertemente correlacionados. (y por lo tanto son sus versiones discretas $y$$w$). Es esta correlación que tengo el propósito de mi modelo de selección: necesito hacer es pequeño, lo que sé que puedo hacer que suceda, ya que hay común influye en $y$ $w$ a partir de las variables explicativas $x$ $v$ (que me quedé distintos en mi notación, pero es probable que tenga un montón de variables comunes en la práctica).
Mis preguntas son:
- ¿Cuáles son las formas para llevar a cabo la elección de los modelos aquí? Hasta el momento, estoy usando un codicioso algoritmo de búsqueda que añade una variable a la vez a $x$ y/o $v$, comprobar cómo la magnitud (o, mejor, la significación) de la $\epsilon$-$\delta$ la corrección se ve afectada, y se elige la variable que proporciona la mejor mejora.
- ¿Debo preocuparme por la exclusión de variables necesarias para la identificación? (Un poco más, y de una forma más precisa, la historia es que el $y$ ecuación es una ecuación de selección, y $w$ ecuación es la respuesta de la ecuación que sólo se aplica a los casos con $y=1$, en una variación del modelo de Heckman. Si la selección de la realidad, depende de $w$, como está implícito en la oferta de mano de obra modelo utilizado por Heckman, nadie lo dice, pero no tiene que ser, en el contexto de mi aplicación).
- ¿Qué otras preguntas que debería hacer?
Algo parecido problema de la modificación de su modelo hasta una cierta prueba estadística se convierte en insignificante se enfrenta en el modelado de ecuaciones estructurales, y no creo que haya una respuesta que me iba a encontrar satisfactoria.