4 votos

¿Cómo interpolar la variable independiente en un período de cinco años?

Dispongo de datos de panel sobre renta y población para los años 1990, 1995, 2000 y 2005. Me gustaría interpolar estas dos variables (ambas independientes), de modo que disponga de datos para cada año entre 1990 y 2005. Me gustaría preguntar si la interpolación spline lineal o cuadrática u otro método sería el más adecuado para hacerlo.

Sé que la interpolación no produce datos reales, sino sólo estimaciones. ¿Cuáles serían los problemas que tendría que abordar si utilizara estos datos interpolados en una regresión de panel estimada por máxima verosimilitud (por ejemplo, autocorrelación serial)?

En caso de autocorrelación serial, los coeficientes de regresión no se verían afectados, sino los valores t y la significación, ¿es así?

0 votos

Además de la autocorrelación, si utiliza un método de interpolación para ambas variables, se produciría multicolinealidad. Si utiliza un método adecuado para la regresión de panel, no tendrá que preocuparse por la autocorrelación, ya que se encargará automáticamente de ella, un ejemplo de error sería ARMA. A mí me preocuparía más la multicolinealidad.

0 votos

Creo que la multicolinealidad sólo sería un problema si utilizara una variable para interpolar la otra. Sin embargo, la idea inicial era utilizar, por ejemplo, el punto de datos 1990 y 1995 para la renta para interpolar los puntos de datos de la renta de los años comprendidos entre 1990 y 1995. Pensaba hacer lo mismo con la variable población.

1voto

Aksakal Puntos 11351

ACTUALIZACIÓN: No puede utilizar los datos interpolados en la regresión si estas dos variables son las únicas variables. La razón es que si estas fueran las únicas variables, entonces al interpolar se inflaría artificialmente el tamaño de la muestra.

Cuando hay otras variables, no está tan claro. Uno de los problemas de la interpolación es que en los datos económicos suele haber un elemento similar a un paseo aleatorio: como es sabido, cuando el tamaño del paso disminuye, la varianza de un paseo aleatorio disminuye proporcionalmente al tamaño del paso. Al interpolar, la desviación estándar, no la varianza, se escala linealmente. En otras palabras, si tuvieras datos anuales, serían más ruidosos que si utilizaras una interpolación lineal o similar. Por tanto, estás desordenando la estructura de errores del modelo. No creo que esto sea siempre un gran problema, por lo que la interpolación puede estar bien.

Creo que el enfoque preferido es construir un modelo basado explícitamente en la frecuencia quinquenal de las variables dependientes.

0 votos

Incluyo más que estas dos variables en mi regresión, pero por razones teóricas no quiero dejar estas dos. He encontrado artículos en los que los investigadores o bien utilizaban los datos de 1990 para todo el quinquenio 1990-1995 o bien "aplicaban la interpolación lineal para rellenar los datos de los años que faltaban".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X