Estoy realizando una serie de regresiones jerárquicas con muchas variables independientes. Todas las variables independientes muestran una relación teórica débil con la variable principal. Mi supervisor ha sugerido excluir las IVs de la regresión basándose en si se correlacionan con la VD o no (si no lo hacen, entonces están fuera). Parece estar lo suficientemente aceptado como para que los estudios que utilizan esta técnica se publiquen en revistas médicas de alto nivel, pero no puedo encontrar una referencia que lo apoye directamente.
También he recibido algunos comentarios negativos con respecto a este proceso, a saber, que debido a que algunos de los IVs excluidos están correlacionados con los IVs incluidos, se ha sugerido que esto afectará al coeficiente potencial de los que quedan en la regresión. Y que incluir sólo las medidas que se espera que sean significativas enmascara la probabilidad de que surjan algunas correlaciones significativas por casualidad.
He encontrado referencias que sugieren que si las variables no son "importantes" entonces excluir las variables que se correlacionan con otras IVs no es un problema.
¿Puede determinarse la importancia de un IV en un modelo por el hecho de que esté o no correlacionado con el VD?