Estoy ejecutando un modelo (regresión logística) con 20 variables independientes en R.
Antes de ejecutar el modelo, calculé la correlación entre todas las variables y finalmente seleccioné mis variables comprobando también "visualmente" los histogramas de cada variable en el caso de la presencia y de nuevo en el caso de la ausencia. En las situaciones en las que no veo ninguna distribución obvia asociada tanto a la presencia como a la ausencia, descarto la variable.
Me gustaría hacer cálculos "oficiales" del nivel de relación entre Presencia/Absencia y cada variable (cuánto contribuye cada variable a la Presencia/Absencia), por ejemplo con Cramer's V index
, pero la función disponible que encuentro es la del paquete vcd
y tiene algunas limitaciones: no da la Cramer's V
(así como el Coeficiente de Contingencia Phi) para cada variable independiente, y no se ejecuta para una variable independiente.
Puede que me falte alguna otra forma obvia de hacerlo. Se agradece cualquier ayuda.