1 votos

Forma extraña de los residuos frente al gráfico ajustado

Estoy haciendo una regresión lineal múltiple con 19 variables explicativas y alrededor de 500.000 puntos de datos. Cuando trazo el gráfico de residuos frente al gráfico de ajuste, veo formas extrañas en las que parece haber varias regiones. Una centrada en torno a 0, una banda vertical por debajo de 0 y una banda tipo embudo por encima de 0.

En general, la forma del embudo puede indicar heteroscedasticidad, pero ¿qué indicarían estas formas múltiples en mi gráfico?

Weird Residuals vs Fitted plot

4voto

Sean Hanley Puntos 2428

Está claro que hay grupos latentes en tus datos. ¿Tiene otras variables, especialmente variables categóricas, que puedan explicar las diferentes franjas? Si es así, hay una interacción entre esa(s) variable(s) categórica(s) y algo más.

En general, hay que examinar los datos antes de ajustar un modelo. No querrá que le sorprendan. ¿Cuáles son sus variables? ¿Qué significan? Intenta mirar las matrices de dispersión, etc.

1voto

Peter Westfall Puntos 11

Una vez vi algo así en un conjunto de datos. El gráfico era de las contribuciones benéficas (Y) frente a los ingresos (X). Había un patrón lineal claro con una pendiente de 0,10 que parecía diferente del resto de la dispersión de datos. Estos eran (creo firmemente) los diezmadores. La variable "diezmar", una variable 0/1, es un tipo de variable latente mencionada por Gung. Es latente porque no se sabe quiénes son los que diezman.

En resumidas cuentas, parece que hay diferentes mecanismos en juego en sus datos, y usted no sabe necesariamente qué observaciones responden a qué mecanismo (como los que diezman o los que no diezman). Para desentrañar estas estructuras latentes, podría considerar el uso de regresiones de conmutación. Una referencia está aquí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X