Actualmente estoy haciendo un análisis de mi Tesis de Maestría y encontrado algunos resultados que no puedo explicar.
En mi papel, yo estoy tratando de explorar los factores que deciden si la gente se unió a un local de la iniciativa de energía o no. Desde que tengo un montón de diferentes variables, a mi instructor propuso un modelo de enfoque de construcción. Concretamente, voy a añadir conjuntos de predictores para mi la regresión logística y mantener sólo aquellos que son significativos en el modelo, antes de añadir el siguiente juego. Para evaluar el ajuste del modelo, me dijeron que el uso de tablas de clasificación.
Mi problema ahora es el siguiente:
Voy a empezar con un conjunto de dummies para el control de los participantes, provenientes de diferentes barrios. Este modelo básico clasifica el 56% de los casos correctamente. Ahora añado el segundo conjunto de predictores y algunos de ellos son significativos, por lo que mantener los del modelo. Si yo ahora uso la tabla de clasificación de nuevo, mi clasificación se puso peor. Incluso peor que la oportunidad! (48%).
¿Cómo puedo encontrar predictores significativos pero mi modelo empeora de oportunidad?
EDITAR PARA INFORMACIÓN ADICIONAL:
Mi conjunto de datos compuesto de 636 casos. 318 son partícipes de la iniciativa, 318 no son partícipes. Los conjuntos de variables que uso están estructurados de la siguiente manera:
1) "Control": la Gente viene desde el 30 de distintos barrios, así que he añadido el 29 de variables ficticias para controlar por diferencias debido a la vecindad de afiliación (no es el mejor enfoque, lo sé, pero estoy siguiendo las órdenes de éste)
2) Los predictores: 15 demográficos y las variables psicológicas
3) Evaluación de predictores de grupo: 8 variables que miden cómo los individuos perciben el grupo de potenciales partícipes
He utilizado las tablas de clasificación en los mismos datos que he utilizado para la construcción del modelo, por desgracia solo tengo esto un conjunto de datos y estoy tratando de averiguar que los predictores más prometedores para el futuro (causational) de investigación.