10 votos

La incorporación de más detallado de las variables explicativas a lo largo del tiempo

Estoy tratando de entender cómo sería la mejor forma de modelo de una variable donde más tiempo he obtenido cada vez más detallada de los predictores. Considere, por ejemplo, el modelado de las tasas de recuperación de los préstamos impagos. Supongamos que tenemos un conjunto de datos con 20 años de datos, y en los 15 primeros de los años sólo sabemos si el préstamo estaba garantizado o no, pero nada acerca de las características de la garantía. Durante los últimos cinco años, sin embargo, podemos romper el colateral en una variedad de categorías que se espera que para ser un buen predictor de la tasa de recuperación.

Dada esta configuración que desee ajustar un modelo a los datos, determinar medidas tales como la significación de los predictores, y luego pronóstico con el modelo.

Qué falta de datos framework hace este ajuste? Hay consideraciones especiales relacionadas con el hecho de que el más detallada de las variables explicativas sólo estarán disponibles después de un punto dado en el tiempo, en lugar de ser esparcidos por todo el histórico de la muestra?

1voto

Bill Denney Puntos 175

Normalmente, esto puede ser visto como un almacén de valor de parámetro problema. Como entiendo tu pregunta, es menos informativo parámetro (garantía de calidad desconocida [Cu]) a comienzos de datos y más informativo (colateral con alta [Ch], medio [Cm], o baja [Cl] la calidad) en la tarde de datos.

Si usted cree que el no-observada parámetros del modelo no cambian con el tiempo, el método puede ser simple, donde se supone que el punto de las estimaciones de cada uno Cl < Cm < Ch y Cl <= Cu <= Ch. La lógica es que la Cl es la peor y la Ch es la mejor, así que cuando los datos son desconocidos debe ser entre o igual a aquellos. Si usted está dispuesto a ser ligeramente restrictiva y asumir que no todos los colateral fue de alta o de baja calidad durante los primeros 15 años, se puede suponer que la Cl < Cu < Ch, lo cual lo hace mucho más sencillo de calcular.

Matemáticamente, estas pueden ser estimadas con algo como: $$ \begin{array}{lcl} C_l &=& \exp(\beta_1) \\ C_m &=& \exp(\beta_1) + \exp(\beta_2) \\ C_u &=& \exp(\beta_1) + \frac{\exp(\beta_3)}{1+\exp(-\beta_4)} \\ C_h &=& \exp(\beta_1) + \exp(\beta_2) + \exp(\beta_3) \end{array} $$

Donde la función logit en Cu restringe el valor a ser entre Cl y Ch sin restricción de ella en relación a la Cm. (Otras funciones de delimitación entre 0 y 1, también pueden ser utilizados.)

Otra diferencia en el modelo debe ser que la varianza debe ser estructurada de tal manera que la varianza residual depende del período de tiempo debido a que la información dentro de cada período es diferente.

1voto

bohan Puntos 522

ACEPTAR, a partir de la experiencia en el uso de datos históricos, más la historia, podría hacer que el ajuste de regresión aparecen mejor, pero si la predicción es el punto de ejercicio, la respuesta general es ser advertido. En el caso de que los datos reflejan los períodos durante los cuales el 'mundo' fue muy diferente, la estabilidad de las correlaciones es cuestionable. Esto ocurre especialmente en la economía, donde los mercados y las regulaciones están en constante evolución.

Esto es válido para el mercado de bienes raíces también que, además, puede tener un largo ciclo. La invención de los valores respaldados por hipotecas, por ejemplo, ha transformado el mercado de hipotecas y abrió las puertas para la creación de hipotecas, y también, por desgracia, la especulación (de hecho, había toda una clase de no/baja documento de préstamos llamado lier préstamos).

Métodos de prueba para los cambios de régimen puede ser especialmente valiosa para decidir en un no-subjetiva de la forma que excluir de la historia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X