4 votos

¿Por qué se mantienen las suposiciones de linealidad y varianza constante en este caso?

entrar descripción de la imagen aquí

Entonces he estado dudando si las suposiciones de linealidad y varianza constante se cumplen con estos gráficos (para un modelo lineal). Lo que me confunde es cómo en el primer gráfico de arriba tenemos como un círculo gaussiano y también la región de mayor densidad de puntos parece desplazarse hacia arriba (lo cual afecta un poco la línea de tendencia media en rojo).

Mi profesor me dice que estos gráficos no violan las suposiciones, ya que no hay un cambio significativo en las medias del eje y sobre el eje x. ¿Realmente es tan simple mirar este tipo de gráficos? El libro que estamos usando dice que para la linealidad queremos ver que los puntos reboten aleatoriamente alrededor de y=0 de manera simétrica en el primer gráfico. Para la varianza constante, queremos ver una distribución verticalmente uniforme de residuos en ese gráfico. Y para la escala de ubicación solo queremos ver que no hay una tendencia importante hacia arriba o hacia abajo.

Aún así, algo en estos gráficos me preocupa. No veo claramente la linealidad y algo parece estar mal al decir que tenemos varianza constante (al alejarse hacia la izquierda o hacia la derecha del centro del grupo de datos, me parece que la varianza comienza a comprimirse).

¿Alguien podría darme un poco más de información y explicación sobre por qué se cumplen las suposiciones de linealidad y varianza constante en este caso?

Actualización

Aquí están los datos reales con la línea de regresión lineal simple ajustada y la línea lowess superpuesta:

entrar descripción de la imagen aquí

Y agregando $\beta_2 x^2$ como se sugiere:

entrar descripción de la imagen aquí

Y $R^2$ aumenta de 2.38% a 3.03%.

3voto

user2735206 Puntos 51

No estoy del todo de acuerdo con el primer gráfico. Por lo general, si la línea de ajuste de bajoess muestra una tendencia no lineal bastante clara como esta, podría haber una relación no lineal entre y cualquiera de las x no contabilizadas. Y que esta curvatura ocurra en un área de alta densidad de datos me hace sentir aún más seguro al respecto. Puedes intentar componer algún "componente más el gráfico residual" para ver cuál es el culpable. Y prueba agregando un término cuadrático de esa variable al modelo y ver si mejora el ajuste general. URL

Sin embargo, estoy de acuerdo en que la varianza es razonable. Tienes razón en que en la segunda figura los puntos parecen estrecharse de izquierda a derecha. Pero también recuerda que la mayoría de las variables tienden a tener menos valores extremos que aquellos más cercanos a su tendencia central (piensa en las colas de una curva normal). Por lo tanto, a medida que el valor ajustado aumenta, esperarías que existan menos casos. En los datos del mundo real, una apariencia perfectamente "en bloque" del gráfico de varianza rara vez existe, a menos que el resultado provenga de alguna distribución como una distribución uniforme.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X