El problema:
Mi estudio versa sobre el impacto del factor humano en el desarrollo regional.
Mis "sujetos" son regiones de la Unión Europea. Existen 276 en total bajo la clasificación NUTS 2. La idea es utilizar una muestra de entre 16 y 20, para poder hacer también un pequeño estudio de caso sobre cada una de ellas y abordarlas también cualitativamente.
Mis variables independientes son estadísticas demográficas (por ejemplo, el porcentaje de personas con títulos universitarios, el porcentaje del PIB regional que se gasta en I+D, etc.). Tengo alrededor de 20 IVs o predictores potenciales diferentes, aunque supongo que puedo agruparlos u omitir algunos innecesarios y reducirlos a unos 8 si es necesario.
Tengo una única variable dependiente que se tomará de alguna escala ampliamente aceptada que muestre el nivel de desarrollo regional, por lo que no es necesario manipularla.
Obviamente, el objetivo es comprobar el impacto de los IVs (tanto por separado como en un modelo completo) en el VD. Una regresión parece ser el camino correcto.
Mis preguntas:
- ¿Es incorrecto intentar comprobar el impacto de 20 predictores en una muestra tan pequeña (16-20 regiones)?
- Si es así, ¿mejorarán las cosas si reduzco los predictores a 8 más o menos?
- ¿Cuál es la mejor manera de reducir o agrupar los predictores en unos pocos importantes? ¿Sentido común? ¿Análisis factorial? ¿Alfa de Cronbach? ¿Una regresión por pasos?
- Si todavía no es suficiente, ¿debería también aumentar el tamaño de la muestra a, por ejemplo, 50 o 100 regiones (de una "población" total de 276) y omitir la parte cualitativa?
- ¿Es una regresión la mejor opción para la prueba "principal"?
- ¿Alguien me ha mencionado una "red neuronal artificial"? ¿No es eso demasiado complicado para un estudio relativamente sencillo como éste?