5 votos

Cómo construir un diagrama de interacción

Estoy debatiendo cómo construir una interacción parcela con mi supervisor.

Tenemos un conjunto de datos compuesto por 8 variables independientes. Estamos tratando de analizar el efecto de la 2 a la 8 de las variables independientes sobre la variable dependiente.

Mi supervisor es lo que sugiere que para dibujar una interacción de la parcela, en primer lugar el ajuste de un modelo completo el uso de todos los 8 de variables independientes que tenemos, y para cada posible combinación de los niveles de las 2 variables independientes que estamos particularmente interesados en la (vamos a llamarlos var1 y var2), calcular su valor de predicción basado en el modelo completo que hemos construido anteriormente. Sin embargo, cuando la aplicación de este método que se ejecuta en un problema porque para mi software estadístico para hacer una predicción, tuve que asignar valores a las 8-2=6 variables que están a la izquierda en el conjunto de datos, que son indeterminado. Así que le sugerí a mi supervisor que en lugar de basarse en el modelo completo para el cálculo de los valores predichos, yo se ajustan a un modelo como el siguiente:

y = var1 + var2 + var1*var2

(es decir, en lugar de y = var1 + var2+ var3 + var4 + var5 + var6 + var7 + var8 + var1*var2)

Mi supervisor, sin embargo, no está de acuerdo con mi punto de vista y me está diciendo que me vaya por el uso de la media de los valores de var3, var4, var5, var6, var7, var8, que puedo calcular a partir de nuestro conjunto de datos original, para llegar con las predicciones.

Hay algo mal con mi método de analizar el efecto de la interacción? Yo prefiero mi método debido a la interacción de la trama se ve mucho mejor con mi método. Sin embargo, si mi método es teóricamente mal, entonces supongo que tiene que atenerse a lo que se dice por mi supervisor.

6voto

Zendmailer Puntos 138

No estoy seguro que entiendo completamente de su supervisor sugerencia, pero el principio que yo uso la hora de elegir cómo crear un gráfico es la de asegurarse de que en el gráfico se representa el análisis que estoy dando en mi papel. Basados en este principio, iba a usar sea cual sea el modelo para crear el gráfico que usted está denunciando en su papel. Por lo tanto, si usted está reportando el siguiente modelo:

$y = var1 + var2 + var1 * var2$

a continuación, me gustaría utilizar este modelo para obtener la predicción de los valores que se representan en el gráfico. Por otro lado, si usted está reportando el siguiente modelo:

$y = var1 + var2 + var3 + var4 + var5 + var6 + var7 + var8 + var9 + var1 * var2$

entonces yo sería la trama de la $var1 * var2$ interacción a partir de este modelo, la media de centrado var3 a través de var9 al obtener los valores predichos para el gráfico.

Suponiendo que el modelo con sus variables de control es el que se está informando en su papel, he incluido algunos R código de la simulación de datos y la creación de una gráfica con los datos de abajo. Puede que desee considerar la posibilidad de imprimir sus $y$ puntos marginados para las diferentes variables de control; si no sabes cómo hacer esto, yo describen cómo realizar esta aquí.

# Set the seed
set.seed(2314)

# Create the data
dat <- matrix(NA, nrow = 200, ncol = 9)
colnames(dat) <- paste0("var", 1:9)
dat <- data.frame(dat)
for(i in 1:9)
{
  dat[, paste0("var", i)] <- rnorm(200, sd = 1)
}
dat$y <- .5 * dat$var1 + .5 * dat$var2 + .5 * dat$var1 * dat$var2 + rnorm(200, sd = 1)

# Fit the model
mod <- lm(y ~ var1 * var2 + var3 + var4 + var5 + var6 + var7 + var8 + var9, data = dat)

# Create a matrix of desired predicted values for the model.  I am holding the control variables
# constant at their means
pX <- expand.grid(var1 = seq(min(dat$var1), max(dat$var1), by = .1), 
                  var2 = c(mean(dat$var2) - sd(dat$var2), mean(dat$var2) + sd(dat$var2)),
                  var3 = mean(dat$var3),
                  var4 = mean(dat$var4),
                  var5 = mean(dat$var5),
                  var6 = mean(dat$var6),
                  var7 = mean(dat$var7),
                  var8 = mean(dat$var8),
                  var9 = mean(dat$var9)
                  )

# Get the predicted values
pY <- predict(mod, pX)

# Create a plotting space
plot(dat$var1, dat$y, frame = F, type = "n", xlab = "var1", ylab = "y")

# Plot the points.  Points for var1 below the median on var2 are plotted in red, 
# points for var1 above the median on var2 are plotted in blue
points(dat[dat$var2 < median(dat$var2), "var1"], dat[dat$var2 < median(dat$var2), "y"], pch = 16, cex = .5, col = "red")
points(dat[dat$var2 >= median(dat$var2), "var1"], dat[dat$var2 >= median(dat$var2), "y"], pch = 16, cex = .5, col = "blue")

# Plot the lines. Lines are colored to be consistent with the points
lines(pX[pX$var2 == mean(dat$var2) - sd(dat$var2), "var1"], pY[pX$var2 == mean(dat$var2) - sd(dat$var2)], col = "red", lwd = 2)
lines(pX[pX$var2 == mean(dat$var2) + sd(dat$var2), "var1"], pY[pX$var2 == mean(dat$var2) + sd(dat$var2)], col = "blue", lwd = 2)

enter image description here

2voto

jasonmray Puntos 1303

Podría ser la pena decir explícitamente lo que está mal con su propuesta y por qué usted debe seguir los consejos dados en @Patricio respuesta:

En primer lugar, si el modelo que está utilizando incluye a otros predictores además de los dos implicados en la interacción, que claramente necesitan para especificar los valores de todos ellos para hacer una predicción mediante el modelo.

En segundo lugar, incluso si sólo estás interesado en mostrar la forma de la respuesta esperada $\operatorname{E} Y$ contra dos predictores, $x_1$ & $x_2$, considere lo que sucede cuando el modelo completo

$$\operatorname{E} Y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \beta_3 x_3 + \ldots + \beta_8 x_8 + \beta_{12} x_1x_2$$

y ajuste de un modelo reducido

$$\operatorname{E} Y = \beta_0^* + \beta_1^* x_1 + \beta_2^* x_2 + \beta_{12}^*x_1x_2$$

¿$\beta_1=\beta_1^*$, $\beta_2=\beta_2^*$, & $\beta_{12}=\beta_{12}^*$?

Respuesta:–

No en general—sólo si se han esmerado en el diseño del experimento para asegurar la ortogonalidad. Así que la interacción de la trama podría ser muy diferente para los dos modelos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X