6 votos

¿La autocorrelación de los residuos es siempre un problema?

He leído que OLS subestima la varianza cuando los residuos están autocorrelacionados. Veo por qué la autocorrelación sería un problema en el análisis de series temporales, en el sentido de que los coeficientes no son eficientes porque no estamos incluyendo todos los predictores potenciales. Pero, ¿existe también un problema matemático?

Por ejemplo, queremos predecir los márgenes de venta de coches usados. El conjunto de datos incluye cada marca de vehículo, el modelo, el kilometraje p/galón, el precio, las opciones, etc. y el precio de venta final. Por alguna razón, el catálogo se ha ordenado por marca y año/modelo del coche, por lo que es probable que las observaciones adyacentes tengan números de venta similares. ¿Es la autocorrelación un problema en este caso?

4voto

GenericTypeTea Puntos 27689

Los residuos correlacionados en el análisis de series temporales pueden implicar algo mucho peor que una baja eficiencia: si la estructura de la autocorrelación implica datos integrados o casi integrados, entonces cualquier inferencia sobre niveles, medias, varianzas, etc. puede ser espuria (con una dirección de sesgo desconocida) porque la media de la población es indefinida y la varianza de la población es infinita (así, por ejemplo, los valores finitos $\bar{x}$ y $s_{x}$ y las cantidades derivadas de ellas son siempre estimaciones falsas de las estadísticas poblacionales correspondientes).

Ese no es un problema que pueda resolverse aumentando el tamaño de la muestra para compensar la ineficiencia.

Si se obtienen errores autocorrelacionados en OLS, diría que pueden darse los mismos problemas (depende del proceso de generación de datos). De nuevo: no es una cuestión de eficiencia.

La advertencia fundamental es si la ordenación de sus datos tiene sentido Si el orden tiene un significado que se relaciona con el proceso de generación de datos, entonces estás en problemas.

1voto

user53211 Puntos 11

1) La autocorrelación de series temporales a la que te refieres es la correlación entre una serie temporal y la serie desplazada en el tiempo; el "tiempo" se observa cuando se recogen los datos. En su ejemplo, la autocorrelación por cambio de fabricante o modelo de coche no es muy significativa. En el caso de los coches nuevos, el desplazamiento del año (comparando las ventas interanuales del mismo tipo de coche) tiene sentido, pero en el caso de los coches usados sería menos significativo, ya que el uso aleatorio al que estaría expuesto el coche borraría las correlaciones si las hubiera. Creo que está bien seguir adelante aplicando la tecnología OLS

2) Estaría ajustando un estimador lineal insesgado, un caso especial de un estimador M. Si su objetivo es construir un modelo predictivo (en lugar de probar hipótesis expresables en términos de parámetros del modelo), entonces el OSL es adecuado. Para cubrir la posibilidad de que no se cumplan los supuestos del modelo, utilice una muestra de entrenamiento para construir su modelo y una muestra de validación para evaluar su rendimiento en casos fuera de la muestra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X