Estoy estimando una regresión lineal: $Y=f(X_1,X_2,X_3,X_4,X_5)$ . Mi prueba muestra que cuando la ecuación incluye $X_4$ y $X_5$ sólo, $X_4$ no es estadísticamente significativo ( $t$ -valor=1,26). Sin embargo, cuando $X_1$ , $X_2$ y $X_3$ su importancia aumenta hasta el nivel significativo ( $t$ -valor =2,36). En otras palabras, la importancia de $X_4$ depende de la presencia de $X_1$ , $X_2$ y $X_3$ en el modelo.
He comprobado la correlación entre $X_4$ y $X_1$ , $X_2$ y $X_3$ . Las correlaciones bivariadas entre ellas son todas inferiores a 0,5. Si lo entiendo bien, la multicolinealidad no debería ser un problema con ese nivel de correlación.
Mi pregunta es: ¿Debo eliminar X4 de mi modelo final? Si no, ¿cómo debo explicar su importancia?