16 votos

La mejor manera de presentar de manera visual las relaciones de un lineal múltiple el modelo de

Tengo un modelo lineal con cerca de 6 predictores y yo voy a ser la presentación de las estimaciones, los valores de F, los valores de p, etc. Sin embargo, me preguntaba cuál sería la mejor visual de la trama para representar el efecto individual de un solo predictor de la variable de respuesta? Diagrama de dispersión? Condicional De La Parcela? Efectos de la parcela? etc? ¿Cómo debo interpretar que la trama?

Voy a estar haciendo esto en R, así que siéntase libre para dar ejemplos si se puede.

EDIT: estoy relacionadas principalmente con la presentación de la relación entre cualquier predictoras y la variable de respuesta.

12voto

Zendmailer Puntos 138

En mi opinión, el modelo que he descrito en realidad no se presta a conspirar, como parcelas funcionan mejor cuando no visualización de información compleja que es difícil de entender de otra manera (por ejemplo, interacciones complejas). Sin embargo, si desea mostrar una parcela de las relaciones en su modelo, usted tiene dos opciones principales:

  1. Mostrar una serie de parcelas de la relación bivariada entre cada uno de sus predictores de interés y su resultado, con un diagrama de dispersión de la materia prima de puntos de datos. La trama de error sobres alrededor de sus líneas.
  2. Ver el trazado de la opción 1, pero en lugar de mostrar la cruda puntos de datos, mostrar los puntos de datos con el resto de los predictores marginados (es decir, después de restar a cabo las contribuciones de los otros predictores)

El beneficio de la opción 1 es la que permite que el espectador para evaluar la dispersión de los datos en bruto. El beneficio de la opción 2 es la que se muestra la observación de errores que resultaron en el error estándar de la focal coeficiente que está mostrando.

He incluido el código R y un gráfico de cada una de las opciones a continuación, utilizando los datos de Prestige conjunto de datos en car paquete en R.

## Raw data ##

mod <- lm(income ~ education + women, data = Prestige)
summary(mod)

# Create a scatterplot of education against income
plot(Prestige$education, Prestige$income, xlab = "Years of education", 
     ylab = "Occupational income", bty = "n", pch = 16, col = "grey")
# Create a dataframe representing the values on the predictors for which we 
# want predictions
pX <- expand.grid(education = seq(min(d$education), max(d$education), by = .1), 
                  women = mean(d$women))
# Get predicted values
pY <- predict(mod, pX, se.fit = T)

lines(pX$education, pY$fit, lwd = 2) # Prediction line
lines(pX$education, pY$fit - pY$se.fit) # -1 SE
lines(pX$education, pY$fit + pY$se.fit) # +1 SE

Graph using raw datapoints

## Adjusted (marginalized) data ##

mod <- lm(income ~ education + women, data = Prestige)
summary(mod)

# Calculate the values of income, marginalizing out the effect of percentage women
margin_income <- coef(mod)["(Intercept)"] + coef(mod)["education"] * Prestige$education + 
        coef(mod)["women"] * mean(Prestige$women) + residuals(mod)

# Create a scatterplot of education against income
plot(Prestige$education, margin_income, xlab = "Years of education", 
         ylab = "Adjusted income", bty = "n", pch = 16, col = "grey")
# Create a dataframe representing the values on the predictors for which we 
# want predictions
pX <- expand.grid(education = seq(min(d$education), max(d$education), by = .1), 
                  women = mean(d$women))
# Get predicted values
pY <- predict(mod, pX, se.fit = T)

lines(pX$education, pY$fit, lwd = 2) # Prediction line
lines(pX$education, pY$fit - pY$se.fit) # -1 SE
lines(pX$education, pY$fit + pY$se.fit) # +1 SE

Adjusted data

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X