No creo que importe mucho. Comprobándolo más tarde te ahorrará trabajo innecesario y agitación en transformaciones innecesarias que podrían resultar inútiles si las variables no estarán en el modelo final. Dicho esto, comprobar vif(model)
no consume mucho tiempo, y siempre puedes esperar con la aplicación de soluciones a posibles problemas de multicolinealidad hasta más tarde.
El problema de la multicolinealidad es que puede distorsionar los coeficientes afectados, cambiar sus signos y su significancia. Lo 'bueno' (debería decir conveniente) de la multicolinealidad es que afecta solo a las variables colineales, pero no afecta al resto de las variables. Esto significa que si la colinealidad solo existe en variables de control, a menudo es aceptable ignorarla.
Puedes comprobar, ver si está en las variables de control. Si lo está, optimízalo y déjalo ahí. Si está en las variables explicativas principales, trabaja en eso ahora antes de optimizar (una forma común es centrar, que se puede hacer usando scale(var_to_scale, scale = FALSE)
Editar: la respuesta de @user3640761 plantea una sugerencia válida, que es que revises las correlaciones altas en tus datos antes de hacer cualquier otra cosa. Es fácil, rápido y puede darte una buena indicación.
0 votos
Nunca debería ocurrir, o bien tienes relaciones lineales perfectas en tus datos o no las tienes. Si la correlación es perfecta, R (y la mayoría del software) es tan amable que te arroja un mensaje de error.