Processing math: 100%

24 votos

¿Hay alguna razón para preferir una medida específica de la multicolinealidad?

Cuando trabajamos con muchas variables de entrada, a menudo nos preocupa multicolinealidad . Hay una serie de medidas de multicolinealidad que se utilizan para detectar, pensar y/o comunicar la multicolinealidad. Algunas recomendaciones comunes son:

  1. Los múltiples R2j para una variable concreta

  2. La tolerancia, 1R2j para una variable concreta

  3. El factor de inflación de la varianza, VIF=1tolerance para una variable concreta

  4. El número de condición de la matriz de diseño en su conjunto:

    max(eigenvalue(X'X))min(eigenvalue(X'X))

(Hay otras opciones que se comentan en el artículo de Wikipedia, y aquí en SO en el contexto de R.)

El hecho de que las tres primeras sean una función perfecta entre sí sugiere que la única ventaja neta posible entre ellas sería psicológica. Por otra parte, los tres primeros permiten examinar las variables individualmente, lo que podría ser una ventaja, pero he oído que el método del número de condición se considera el mejor.

  • ¿Es cierto? ¿Mejor para qué?
  • ¿Es el número de condición una función perfecta del R2j 's? (Yo pensaría que sí.)
  • ¿Considera la gente que uno de ellos es más fácil de explicar? (Nunca he intentado explicar estos números fuera de clase, sólo doy una descripción suelta y cualitativa de la multicolinealidad).

17voto

Zizzencs Puntos 1358

A finales de los 90, hice mi tesis sobre la colinealidad.

Mi conclusión fue que los índices de condición eran los mejores.

La razón principal era que, en lugar de mirar a individual variables, le permite ver establece de variables. Dado que la colinealidad es una función de conjuntos de variables, esto es positivo.

Además, los resultados de mi estudio Monte Carlo mostraron una mayor sensibilidad a la colinealidad problemática, pero hace tiempo que olvidé los detalles.

Por otro lado, es probablemente la más difícil de explicar. Mucha gente sabe lo que R2 es. Sólo un pequeño subgrupo de esas personas ha oído hablar de los valores propios. Sin embargo, cuando he utilizado los índices de condición como herramienta de diagnóstico, nunca me han pedido explicaciones.

Para saber mucho más sobre esto, consulta los libros de David Belsley. O, si realmente quieres, puedes conseguir mi disertación Diagnósticos de multicolinealidad para la regresión múltiple: Un estudio Monte Carlo

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X