58 votos

¿Cómo visualizar un modelo de regresión múltiple ajustado?

Actualmente estoy escribiendo un artículo con varios análisis de regresión múltiple. Mientras que la visualización de la regresión lineal univariante es fácil a través de gráficos de dispersión, me preguntaba si hay alguna buena manera de visualizar las regresiones lineales múltiples.

Actualmente sólo estoy trazando gráficos de dispersión como la variable dependiente frente a la primera variable independiente, luego frente a la segunda variable independiente, etc. Agradecería cualquier sugerencia.

7 votos

Una posibilidad: Añadir parcelas variables

1 votos

De posible interés también: Predicho por el gráfico de residuos en R .

1 votos

Ver el effects paquete en R

34voto

Sean Hanley Puntos 2428

No hay nada malo en su estrategia actual. Si tiene un modelo de regresión múltiple con sólo dos variables explicativas, entonces podría intentar hacer un gráfico en 3D que muestre el plano de regresión predicho, pero la mayoría de los programas no facilitan esta tarea. Otra posibilidad es utilizar un coplot (ver también: coplot en R o este pdf ), que pueden representar tres o incluso cuatro variables, pero mucha gente no sabe cómo leerlas. Sin embargo, en esencia, si no hay interacciones, entonces la predicción marginal relación entre $x_j$ y $y$ será la misma que la prevista condicional relación (más o menos algún desplazamiento vertical) en cualquier nivel específico de su otro $x$ variables. Por lo tanto, puede simplemente establecer todas las demás $x$ variables a sus medias y encontrar la línea de predicción $\hat y = \hat\beta_0 + \cdots + \hat\beta_j x_j + \cdots + \hat\beta_p \bar x_p$ y trazar esa línea en un gráfico de dispersión de $(x_j, y)$ pares. Además, terminará con $p$ tales gráficos, aunque podría no incluir algunos de ellos si considera que no son importantes. (Por ejemplo, es común tener un modelo de regresión múltiple con una sola variable de interés y algunas variables de control, y sólo presentar el primer gráfico de este tipo).

Por otro lado, si usted hacer tienen interacciones, entonces debe averiguar cuál de las variables que interactúan le interesa más y trazar la relación prevista entre esa variable y la variable de respuesta, pero con varias líneas en el mismo gráfico. La otra variable que interactúa se establece en diferentes niveles para cada una de esas líneas. Los valores típicos serían la media y $\pm$ 1 DE de la variable interactiva. Para que esto quede más claro, imagine que sólo tiene dos variables, $x_1$ y $x_2$ y tienes una interacción entre ellos, y eso $x_1$ es el foco de su estudio, entonces podría hacer un solo gráfico con estas tres líneas:
\begin{align} \hat y &= \hat\beta_0 + \hat\beta_1 x_1 + \hat\beta_2 (\bar x_2 - s_{x_2}) + \hat\beta_3 x_1(\bar x_2 - s_{x_2}) \\ \hat y &= \hat\beta_0 + \hat\beta_1 x_1 + \hat\beta_2 \bar x_2 \quad\quad\quad\ + \hat\beta_3 x_1\bar x_2 \\ \hat y &= \hat\beta_0 + \hat\beta_1 x_1 + \hat\beta_2 (\bar x_2 + s_{x_2}) + \hat\beta_3 x_1(\bar x_2 + s_{x_2}) \end{align}

Un ejemplo de gráfico similar (aunque con un moderador binario) puede verse en mi respuesta a Trazar la regresión con la interacción en R .

12voto

Jacob Ikabruob Puntos 400

Aquí es una herramienta interactiva basada en la web para trazar resultados de regresión en tres dimensiones.

Este gráfico 3D funciona con una variable dependiente y dos variables explicativas. También puede poner el intercepto a cero (es decir, eliminar el intercepto de la ecuación de regresión).

Esta página muestra un gráfico de dispersión en 3D sin el modelo de regresión ajustado.

MiaBella AI 3D Multiple Regression

0 votos

El sitio no funciona ahora - me aparece una página de aterrizaje de GoDaddy

0 votos

Gracias por mencionar esto. He actualizado las URLs.

0 votos

Eso es hermoso.

6voto

erik Puntos 3923

Para visualizar el modelo en lugar de los datos, JMP utiliza un gráfico interactivo de "perfil". Esta es una vista estática.

enter image description here

Y aquí hay un enlace a un vista dinámica .

Es similar a tu idea del diagrama de dispersión y puede combinarse con ella. La idea es que cada fotograma muestra una porción del modelo para las variables X e Y correspondientes con las otras variables X mantenidas constantes en sus valores indicados. En la versión interactiva, los valores X pueden cambiarse arrastrando las líneas verticales rojas.

Revelación: Soy un desarrollador de JMP, así que no tome esto como un respaldo imparcial.

2 votos

¿No es crucial que represente los residuos de la variable dependiente con los residuos de los predictores? Pensé que debería serlo, ya que representan las verdaderas relaciones entre las variables, pero parece que no se recomienda.

1 votos

@AgusCamacho, si sigues interesado en eso, deberías hacer una nueva pregunta.

1voto

dan90266 Puntos 609

Ver la R rms y el paquete Notas del curso RMS En particular, el nomogram y Predict para obtener nomogramas y gráficos de efectos parciales. La página web summary.rms calcula los resúmenes de efectos de un número de cada predictor (efectos de rango intercuartil). Los nomogramas proporcionan la representación individual más completa de los modelos de regresión, si no hay demasiados términos de interacción.

0 votos

Esto no parece una respuesta completa. ¿Podría decir qué son los nomogramas y cómo funcionan? ¿Podría mostrar un ejemplo? Esto parece apuntar sobre todo a sus materiales en otro lugar, lo que es más adecuado para un comentario.

0 votos

Cuando he dedicado mucho trabajo a describir completamente las cosas en un recurso web diferente, creo que no es útil duplicar el esfuerzo copiando el material aquí. Pero a su pregunta vea stats.stackexchange.com/questions/155430

0 votos

Es razonable, pero entonces esto debería ser un comentario.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X