Estimo algunos modelos logísticos y OLS sobre datos de encuestas grandes (el sobreajuste no debería ser un problema) en los que necesito controlar el país de un encuestado. La variable país está codificada como iso3n- 3 dígitos para cada país único (hay 96 países individuales en mis datos). Lo importante es que sólo quiero controlar el efecto de un país, no estoy interesado en la importancia o los parámetros de cada país.
Me pregunto cuál es la razón teórica para codificar el país como 96 dummies con nivel de base adicional. ¿Por qué no podría simplemente tratar las variables nominales de país como cuasilineales y controlar así su efecto sobre mis otras variables?
Ya he intentado estimar dos modelos en R; uno con variables ficticias y otro con una única variable nominal "país", pero los parámetros estimados de mi variable independiente clave difieren. ¿A qué se debe? También he buscado en el sitio web, pero la mayoría de las entradas sobre el tema dan por supuesto que es necesaria la codificación de variables ficticias.