7 votos

Regresión múltiple - Pruebas de multicolinealidad

Digamos que tengo un modelo de regresión que se ve así. El objetivo es predecir el saldo de la tarjeta de crédito dado un número de variables independientes.

introducir descripción de la imagen aquí

Este es solo el primer paso en el modelo y aún no se ha intentado optimizar. Me pregunto cuándo es el mejor momento para hacer una prueba de multicolinealidad. ¿Es ahora antes de avanzar más o debería ocurrir después de haber reducido a lo que creemos que serán nuestras variables independientes finales?

0 votos

Nunca debería ocurrir, o bien tienes relaciones lineales perfectas en tus datos o no las tienes. Si la correlación es perfecta, R (y la mayoría del software) es tan amable que te arroja un mensaje de error.

5voto

Yuval Sp Puntos 316

No creo que importe mucho. Comprobándolo más tarde te ahorrará trabajo innecesario y agitación en transformaciones innecesarias que podrían resultar inútiles si las variables no estarán en el modelo final. Dicho esto, comprobar vif(model) no consume mucho tiempo, y siempre puedes esperar con la aplicación de soluciones a posibles problemas de multicolinealidad hasta más tarde.

El problema de la multicolinealidad es que puede distorsionar los coeficientes afectados, cambiar sus signos y su significancia. Lo 'bueno' (debería decir conveniente) de la multicolinealidad es que afecta solo a las variables colineales, pero no afecta al resto de las variables. Esto significa que si la colinealidad solo existe en variables de control, a menudo es aceptable ignorarla.

Puedes comprobar, ver si está en las variables de control. Si lo está, optimízalo y déjalo ahí. Si está en las variables explicativas principales, trabaja en eso ahora antes de optimizar (una forma común es centrar, que se puede hacer usando scale(var_to_scale, scale = FALSE)

Editar: la respuesta de @user3640761 plantea una sugerencia válida, que es que revises las correlaciones altas en tus datos antes de hacer cualquier otra cosa. Es fácil, rápido y puede darte una buena indicación.

2voto

TheStrangeQuark Puntos 102

Quizás soy la última persona en responder a esta pregunta, pero ¿cuál sería la desventaja de realizar un análisis de correlación antes de la regresión solo para obtener una idea de los datos y luego pensar si la multicolinealidad afecta la predicción del modelo?

0 votos

Hay formas de colinealidad que esto no detectaría pero no hay razón para no hacerlo.

1voto

Mohammadreza Puntos 1964

La pregunta es sobre "pruebas" para la multicolinealidad. Yo argumentaría que no es posible porque la multicolinealidad es una característica de la muestra y no de la población.

Referencia: http://davegiles.blogspot.com.au/2013/06/can-you-actually-test-for.html

Las respuestas dadas por @Yuval y @user3640761 dan diagnósticos útiles, pero no son pruebas estadísticas.

Esa es mi respuesta: Puedes usar VIF o correlación por pares (por ejemplo, matriz de gráficos de dispersión) para verificar la multicolinealidad, pero no puedes probarlo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X