5 votos

El modelado de la tasa de vacantes de

Tengo 100 de las regiones geográficas de un país. Para cada región, el número total de viviendas y el número de casas vacías han sido recogidos anualmente más de 20 años. Tengo también algunos otros indicadores económicos a nivel de los países (PIB, tasa de interés, etc.). Ahora bien, dado que las previsiones para estos indicadores para el próximo año, quiero previsión para el próximo año la tasa de vacantes.

Yo el primero en utilizar un auto-regresivo mixtos-modelo de efectos en R (paquete lme4) donde la tasa de desocupación (calculada como la proporción de casas vacías sobre el número total de viviendas) en una región que depende en el último año la tasa de desocupación, la media de la tasa de vacantes de las regiones vecinas, el PIB y la tasa de interés.

El problema con este modelo es que la tasa de desocupación puede ir fuera del intervalo [0,1], que obviamente no tiene sentido. Necesito limitar el rango de la tasa de vacantes: una solución sencilla es la restricción ex post.

¿Alguien tiene experiencia con estos modelos? Creo que puedo usar algunos mezclados multinomial logit modelo probablemente.

Les agradecería si pueden brindar orientación, junto con algunos R código.

Saludos

4voto

Marc-Andre R. Puntos 789

Uno de los trucos en la modelización de los porcentajes es el uso de la transformación logit. Entonces, en lugar de la modelización porcentaje $p_i$ como función lineal que el modelo logit de transformación de este porcentaje:

\begin{align} y_i=\log\frac{p_i}{1-p_i} \end{align}

En R, usted tendrá que crear nueva variable transformada y utilizarlo como una variable dependiente en lmer.

Usted puede mirar en el modelado directamente el número de casas vacías en lugar de porcentajes, entonces usted no tendrá un problema con no sensical valores. Yo sugiero utilizar la transformación de registro para que. Por supuesto, esto significa que usted puede conseguir a más no de casas vacías que hay casas, pero esto puede ser utilizado como un indicador de modelo de insuficiencias. Por otro lado, si usted tiene para algunas regiones del total de la reserva en los datos históricos lo que significa que la demanda era mayor que la oferta, es posible que desee ver en el censurado modelos de regresión.

3voto

Berek Bryan Puntos 349

Tendría sentido usar un generalizada modelo lineal mixto con family=binomial y un logit o probit enlace. Esto limitaría sus valores ajustados para el intervalo (0,1). No sé si se puede combinar con un proceso autorregresivo de error estructura en lmer4 , aunque.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X