Estoy debatiendo cómo construir una interacción parcela con mi supervisor.
Tenemos un conjunto de datos compuesto por 8 variables independientes. Estamos tratando de analizar el efecto de la 2 a la 8 de las variables independientes sobre la variable dependiente.
Mi supervisor es lo que sugiere que para dibujar una interacción de la parcela, en primer lugar el ajuste de un modelo completo el uso de todos los 8 de variables independientes que tenemos, y para cada posible combinación de los niveles de las 2 variables independientes que estamos particularmente interesados en la (vamos a llamarlos var1
y var2
), calcular su valor de predicción basado en el modelo completo que hemos construido anteriormente. Sin embargo, cuando la aplicación de este método que se ejecuta en un problema porque para mi software estadístico para hacer una predicción, tuve que asignar valores a las 8-2=6 variables que están a la izquierda en el conjunto de datos, que son indeterminado. Así que le sugerí a mi supervisor que en lugar de basarse en el modelo completo para el cálculo de los valores predichos, yo se ajustan a un modelo como el siguiente:
y = var1 + var2 + var1*var2
(es decir, en lugar de y = var1 + var2+ var3 + var4 + var5 + var6 + var7 + var8 + var1*var2
)
Mi supervisor, sin embargo, no está de acuerdo con mi punto de vista y me está diciendo que me vaya por el uso de la media de los valores de var3, var4, var5, var6, var7, var8
, que puedo calcular a partir de nuestro conjunto de datos original, para llegar con las predicciones.
Hay algo mal con mi método de analizar el efecto de la interacción? Yo prefiero mi método debido a la interacción de la trama se ve mucho mejor con mi método. Sin embargo, si mi método es teóricamente mal, entonces supongo que tiene que atenerse a lo que se dice por mi supervisor.