Tenemos un conjunto de agentes que deben elegir una y sólo una alternativa de un gran número de ellos (max # de alternativas = 120). Agentes de tomar la decisión varias veces, sin el reemplazo de las alternativas elegidas en las primeras iteraciones (por Lo que el número de alternativas es en primer lugar de 120, a continuación, 119, a continuación, 118, etc.). Cada vez que un agente toma una decisión es un grupo de alternativas (es decir, un agente de decisiones una decisión = un grupo de alternativas a elegir entre). Para cada grupo alternativo, queremos estimar la probabilidad de que el agente de elección de cualquiera de las alternativas. Ya sabemos que una de las alternativas en el grupo será elegido, la suma de estas probabilidades debe ser 1. Estamos modelando la toma de decisión como una función de:
- las características de las alternativas y
- algunas de las características del agente que interactúan con las alternativas de características.
Tenga en cuenta que las características de las alternativas y de los agentes varían de un grupo a otro; tanto las alternativas y los agentes son cambiantes a través del tiempo (por ejemplo, Si una de las alternativas es "bus" y ha el precio de la propiedad, el precio es variable en cada agrupación. Del mismo modo, si los agentes tienen la propiedad de "renta", los ingresos son variables en cada grupo). También tenga en cuenta que no tenemos ninguna razón para creer que hemos observado agente de efectos específicos en nuestro escenario. De hecho, tenemos razones para creer que la interacción de nuestro agente específico de variables con aquellas que describen las alternativas son capaces de captar cualquier posible agente-efecto específico.
Cómo hacer el modelo de esto?
El McFadden del modelo de elección (asclogit
en Stata) es una opción, pero:
- Es demasiado lento para nuestros propósitos
- De hecho, incluso no converge
- Se incluye un análisis de lo que nos interesa ahora; tiene una variable ficticia para cada alternativa (por ejemplo, "bus", frente a "taxi") cuando todos estamos en la actualidad interesa es la alternativa de medición de propiedades (por ejemplo, "precio").
- No sabemos cómo ponerlo en práctica en R, que van a tener que hacer
Por lo tanto, ejecutar un modelo logit condicional (clogit
en Stata, o clogit
en survival
en R). Desde aquí nos gustaría obtener las probabilidades ajustadas de varias variables de interés. Sin embargo, la interpretación de los resultados ha demostrado ser complicado, porque en un logit condicional no es posible obtener los efectos marginales, o las probabilidades ajustadas de variables particulares. Normalmente la gente sugeriría mirar los odds ratios. En nuestro caso, esto es muy complicado por el hecho de que muchas de las variables de interés se implementó el uso de un restringido cubic spline. Todo el problema de no ser capaz de obtener los efectos marginales o probabilidades ajustadas parece ser debido a que logit condicional de ejecución de efectos fijos, que realmente no necesitan y que sólo complican la post-estimación de análisis en nuestro caso.
Regular de un modelo logit, sin acondicionado, permitiría estimar los efectos marginales (incluso con restricciones de splines cúbicos). Por desgracia, la suma de las probabilidades pronosticadas para cada grupo no es igual a 1. Así que, aquí viene la pregunta: ¿hay una manera de condicionar la probabilidad de observar un resultado positivo para la alternativa j y el agente i en una forma que la suma de las probabilidades de cada grupo es igual a 1, sin tener que asumir que hay algún agente específico de efectos fijos?