1 votos

Identificación de modelos de elección discreta

Consideremos el modelo Logit clásico. En particular, dejemos que $\mathcal{Y}\equiv (0,1,...,L)$ sea el conjunto de opciones disponibles para los consumidores, donde $0$ denota la opción exterior. Sea $$ u_y\equiv \begin{pmatrix} \beta_y' X_y+\epsilon_y & \text{ if } y>0\\ \epsilon_y& \text{ if } y=0\\ \end{pmatrix} $$ sea la retribución derivada de la elección de la opción $y\in \mathcal{Y}$ . Sea $\{\epsilon_y\}_{y\in \mathcal{Y}}$ sea i.i.d. Gumbel con escala $1$ y ubicación $0$ .

Supongamos que el investigador conoce la distribución de probabilidad de $Y$ con la condición de $X\equiv (X_1,...,X_L)$ . Entonces, se puede demostrar que $(\beta_1,...,\beta_L)$ es el punto identificado. De hecho, $$ Pr(Y=y|X)=\begin{cases} \frac{\exp(\beta_y'X_y)}{\sum_{y\in \mathcal{Y}}\exp(\beta_y'X_y)}& \text{ if } y>0\\\\ \frac{1}{\sum_{y\in \mathcal{Y}}\exp(\beta_y'X_y)}& \text{ if } y=0\\\\ \end{cases} $$ Por lo tanto, para $y>0$ , $$ \log(Pr(Y=y|X))-\log(Pr(Y=0|X))=\beta_y'X_y $$ $$ \Updownarrow $$ $$ [\log(Pr(Y=y|X))-\log(Pr(Y=0|X))]X_y'=\beta_y'X_y X_y' $$ $$ \Updownarrow $$ $$ E\Big([\log(Pr(Y=y|X))-\log(Pr(Y=0|X))]X_y'\Big)=\beta_y'E\Big(X_y X_y'\Big) $$ $$ \Updownarrow $$ $$ E\Big([\log(Pr(Y=y|X))-\log(Pr(Y=0|X))]X_y'\Big)E^{-1}\Big(X_y X_y'\Big)=\beta_y' $$

donde el lado izquierdo es conocido y está bien definido siempre que $E^{-1}\Big(X_y X_y'\Big)$ existe.

Pregunta: Me gustaría replicar la misma prueba cuando $\{\epsilon_y\}_{y\in \mathcal{Y}}$ son normales estándar i.i.d., pero estoy luchando porque obtengo expresiones bastante complicadas cuando uso la cdf de la normal estándar. ¿Podríais ayudarme? ¿Y si en lugar de la normal estándar, asumo que $(\epsilon_0,...,\epsilon_L)\sim N((0,0,...,0),\begin{pmatrix} 1& \rho & \rho & ... & \rho\\ \rho & 1 & \rho & ... & \rho\\ ... & ... & ... & ... & ...\\ \rho & \rho & \rho & ... & 1\\ \end{pmatrix})$

1voto

CloseToC Puntos 513

Me gustaría replicar la misma prueba cuando {y}yY son i.i.d. normales, pero estoy luchando porque obtengo expresiones bastante complicadas expresiones bastante complicadas cuando se utiliza la cdf de la normal estándar.

Las probabilidades de elección $\Pr(Y=y|X)$ no tienen una solución de forma cerrada para el caso de error normal multinomial. Que sí la tienen para los errores de Gumbel (que dan diferencias de errores logísticos) es el razón principal por la que el modelo logístico se utiliza para resultados que implican muchas opciones, a pesar de implicar restricciones inverosímiles como la independencia de las alternativas irrelevantes.

La ausencia de una solución de forma cerrada es un problema importante para la identificación y estimación de estos modelos.

A la hora de identificar, no se puede proceder como se ha hecho, e invertir las probabilidades de elección para obtener los parámetros en función de las características de la distribución de observables $\Pr(Y,X)$ .

No obstante, el modelo está identificado, y es estimable con la simulación.

¿Y si en lugar de la normalidad estándar, asumo que [...]

También se identifica, pero no es cierto que se identifique una matriz de covarianza de varianza completamente irrestricta.

Desde la identificación pruebas para el probit multinomial no se dan en el excelente libro de texto de Kenneth Train (Discrete Choice Methods with Simulation), siempre he supuesto que son bastante técnicos.

Si quieres comprobarlo, la referencia es Bunch (1991), Estimabilidad en el modelo probit multinomial .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X