4 votos

Predecir mejor secuencia de acción para el conjunto de datos de observaciones de la deuda

Necesito algunas sugerencias generales de la predicción de la práctica en el siguiente caso: tengo un conjunto de datos de la deuda observaciones; hay ~8 variables de la definición de cada deudor de la situación (de la deuda de los detalles y los detalles de la persona), cuantitativos y cualitativos. La Gestión de la Deuda aplicado para cada persona de una secuencia de acciones (hay un par de tipos de acciones, cada uno de los diferentes costos y diferentes promedio de efectividad). Los resultados que tengo en uso constan de 2-elem vector:

[agreement, success_in_court]
  • agreement es de 1/0 del valor, es sinónimo de llegar a un acuerdo con el deudor o no
  • success_in_court es de 1/0 de valor, stands para alcanzar el éxito en los tribunales en caso de que esta acción (a demandar a un deudor) fue aplicada por la Gestión de la Deuda

Lógicamente, no más de un elemento de una "respuesta " vector" puede ser de valor 1. El punto es predecir la más rentable de la secuencia de acción para el futuro de los deudores. ¿Qué métodos puedo utilizar? Que debería ser implementado en R.

2voto

Bill Puntos 3605

Para responder a la pregunta, estoy suponiendo que las variables que se tienen en los datos son como este. Cada observación es una deuda. Las variables dependientes son las dos que mencionas. Las variables independientes son de dos tipos. Un tipo son las características de la deuda y/o el deudor. Otro tipo son descripciones de lo que la secuencia de acciones fue tomada.

Entonces la pregunta de investigación es: "¿Cómo hacer la secuencia de acciones y de la deuda y el deudor características de determinar los resultados?" Quiero saber si esta caracterización está mal, y voy a modificar mi respuesta.

La primera cosa que debes hacer es definir una nueva variable $Y$. Esta nueva variable será igual a 1 si (agreement==0 & success_in_court==0). Va a ser igual a 2 si (agreement==1 & success_in_court==0). Que será igual a 3 si (agreement==0 & success_in_court==1). Supongo que nunca sucede que ambas variables son iguales a 1, pero si eso sucede a veces, a continuación, hacer un cuarto nivel de $Y$.

Ahora, reunir las características de la deuda y el deudor, las acciones tomadas, y las interacciones entre estos en un vector de variables independientes $X_i$. El modelo de la probabilidad de los tres resultados, me gustaría utilizar el modelo logit multinomial: \begin{align} P\{Y_i=k|X_i\} &= \frac{exp(X_i\beta_k)}{\sum_{k'=1}^K exp(X_i\beta_{k'})} \end{align}

Este modelo puede ser estimado en R el uso de la mlogit paquete, aquí.

Mucho más podría decirse sobre esto, por supuesto. Todas las preocupaciones comunes de la endogeneidad surgir en estos modelos como en otros modelos. Hay otras preocupaciones acerca de los supuestos modelo logit multinomial se pone las correlaciones entre los diferentes resultados posibles. Usted tiene que tener cuidado en el cálculo de los efectos marginales de cada una de las $X$ en las probabilidades de los diferentes resultados.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X