Antecedentes: estoy tratando de mostrar un aumento en el número de variables a lo largo de time
, por lo que inicialmente me corrió una regresión lineal simple. Sin embargo, me crea un subconjunto de los datos, de modo que pudiera tener una regresión a estimar para cada species
y reef
combinación (que indican el cambio por año).
La totalidad de la regresión sería algo como
lm(Density ~ Time, data=data, subset=ReefSpecies=="ReefSpecies1)
.
A continuación se muestra la salida para Density
una de las variables de respuesta, donde Little Grecian, etc = Reef
y O. annularis, etc = Species
. Hay 3 principales y 2 marginalmente significativa ReefSpecies
con time
.
La segunda columna es el estimate
, la tercera columna es el F-value
, y la última columna es el p-value
.
Por supuesto, yo estaba feliz con el resultado, pero yo también quería hacer un modelo lineal para ver lo que es la contabilidad de este aumento/disminución/ningún cambio en mi respuesta variables.
El modelo lineal se ve algo como esto: lm(Density ~ Species + I(Chl_zoox^0.25) + Season + TN + Biomass + Turbidity + FvFm + Time, data=Seasonal)
y el resultado indica que time
es poco significativo.
Último, me dijeron que si me corrió una regresión con un 3-way interacción de Reef*Species*Time
(por ejemplo lm(Density ~ I(Chl_zoox^0.25) + Season + TN + Biomass + Turbidity + FvFm + Species*Reef*Time, data=Seasonal)
) que iba a obtener teóricamente obtener el mismo estimaciones de la regresión lineal simple (lm(Density ~ Time, data=data, subset=ReefSpecies=="ReefSpecies1)
). Claramente, este no es el caso, y yo recibimos NA
para algunos de los de salida.
Pregunta:
1. Por qué hay una diferencia entre el significado de la regresión múltiple y la regresión simple?
Desde mi entender, la regresión múltiple tiene más poder y, por tanto, debe ser importante.
2. Creo que podría ser la interpretación de las interacciones de forma incorrecta, pero parece que los estimados en la regresión simple no son iguales (pero cerca) de la regresión múltiple de las estimaciones (e.g - Jaap - O. faveolata = -0.2504
en la regresión simple, pero en la regresión múltiple 0.001487 + 0.092568 + 0.559377 - 0.818717 = -0.1652
).
¿Cómo puedo interpretar esta interacción para obtener valores similares? Y ¿por qué no ser significativo?
3. ¿Cuál es el trato con NA
, en la interacción de salida? Qué tiene que ver esto con la multicolinealidad?