Estoy tratando de entender cómo sería la mejor forma de modelo de una variable donde más tiempo he obtenido cada vez más detallada de los predictores. Considere, por ejemplo, el modelado de las tasas de recuperación de los préstamos impagos. Supongamos que tenemos un conjunto de datos con 20 años de datos, y en los 15 primeros de los años sólo sabemos si el préstamo estaba garantizado o no, pero nada acerca de las características de la garantía. Durante los últimos cinco años, sin embargo, podemos romper el colateral en una variedad de categorías que se espera que para ser un buen predictor de la tasa de recuperación.
Dada esta configuración que desee ajustar un modelo a los datos, determinar medidas tales como la significación de los predictores, y luego pronóstico con el modelo.
Qué falta de datos framework hace este ajuste? Hay consideraciones especiales relacionadas con el hecho de que el más detallada de las variables explicativas sólo estarán disponibles después de un punto dado en el tiempo, en lugar de ser esparcidos por todo el histórico de la muestra?