1 votos

Variable de control nominal: ¿realmente tiene que ser ficticia?

Estimo algunos modelos logísticos y OLS sobre datos de encuestas grandes (el sobreajuste no debería ser un problema) en los que necesito controlar el país de un encuestado. La variable país está codificada como iso3n- 3 dígitos para cada país único (hay 96 países individuales en mis datos). Lo importante es que sólo quiero controlar el efecto de un país, no estoy interesado en la importancia o los parámetros de cada país.

Me pregunto cuál es la razón teórica para codificar el país como 96 dummies con nivel de base adicional. ¿Por qué no podría simplemente tratar las variables nominales de país como cuasilineales y controlar así su efecto sobre mis otras variables?

Ya he intentado estimar dos modelos en R; uno con variables ficticias y otro con una única variable nominal "país", pero los parámetros estimados de mi variable independiente clave difieren. ¿A qué se debe? También he buscado en el sitio web, pero la mayoría de las entradas sobre el tema dan por supuesto que es necesaria la codificación de variables ficticias.

0voto

Christoph Hanck Puntos 4143

No estoy del todo seguro de que estemos de acuerdo en lo que se refiere a "cuasilineal", pero suponiendo que esto equivalga, digamos, a codificar Albania como 1 y Zimbabue como 96 y, digamos, Malaui como 48, eso equivaldría a suponer que, en términos de su variable dependiente, usted espera que el efecto para Zimbabue sea dos veces mayor que para Malaui y 96 veces mayor que para Albania.

Es de suponer que esto no es lo que usted desea, ya que sólo quiere tener en cuenta los efectos de cada país por separado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X