Hay varias alternativas a Regresión Paso a Paso. Las más utilizadas que he visto son:
- Opinión de expertos para decidir qué variables incluir en el modelo.
- Regresión de Cuadrados Mínimos Parciales. Básicamente obtienes variables latentes y haces una regresión con ellas. También podrías hacer PCA tú mismo y luego usar las variables principales.
- Operador de Encogimiento y Selección Absoluto Mínimo (LASSO).
Tanto la Regresión de Cuadrados Mínimos Parciales como el LASSO están implementados en paquetes de R como
PLS: http://cran.r-project.org/web/packages/pls/ y
LARS: http://cran.r-project.org/web/packages/lars/index.html
Si solo quieres explorar la relación entre tu variable dependiente y las variables independientes (por ejemplo, no necesitas pruebas de significancia estadística), también recomendaría métodos de Aprendizaje Automático como Random Forests o Árboles de Clasificación/Regresión. Random Forests también puede aproximar relaciones no lineales complejas entre tu variable dependiente y las variables independientes, que podrían no haber sido reveladas por técnicas lineales (como Regresión Lineal).
Un buen punto de partida para Aprendizaje Automático podría ser la vista de tareas de Aprendizaje Automático en CRAN:
Vista de Tareas de Aprendizaje Automático: http://cran.r-project.org/web/views/MachineLearning.html
4 votos
Otras personas mencionan procedimientos estadísticos que pueden ser útiles, pero primero me gustaría preguntar si tienes alguna teoría sobre la fuerza y forma de la relación entre variables. ¿Qué tan grande es tu muestra? ¿Tienes razones para evitar modelos complejos?
2 votos
¿Alguien ha considerado el promedio de modelos como una alternativa para combatir el sesgo de preprueba y los problemas de mala especificación? A grandes rasgos, todas las variables son posibles predictores y puede estimar la probabilidad de que sean útiles. Por lo tanto, el estimador combinado no solo mejora el rendimiento de pronóstico, sino que también produce buenas estimaciones de propiedades para los parámetros de variables bajo "scope".
1 votos
Contracción. Nadie usa stepwise ya, con suerte