3 votos

¿Cómo incluir covariables en un modelo anidado?

Soy nuevo en el modelo multinivel y tengo problemas para entender cómo incluir covariables. En mi modelo, tengo Industria y País como dos factores. Tengo que controlar los efectos de las siguientes dos covariables para determinar el efecto de mi variable focal X en Y: IndustriaRentabilidad y PaísCalificacionesRiesgo. ¿Cuál de las siguientes crees que es la especificación de modelo más apropiada para este propósito?

Modelo 1 = lmer(Y ~ X + IndustriaRentabilidad + PaísCalificacionesRiesgo, misDatos)

Modelo 2 = lmer(Y ~ X + (1|Industria)+ (1|País), misDatos)   

Modelo 3 = lmer(Y ~ X + (1|Industria)+ (1|País) + IndustriaRentabilidad + PaísCalificacionesRiesgo, misDatos)

Me dijeron que Modelo 3 es el más apropiado ya que hay falta de independencia en mis datos debido a la industria y el país. Pero estoy confundido ya que las dos covariables (por ejemplo, IndustriaRentabilidad) relacionadas con un nivel más alto (por ejemplo, Industria) se incluyen como efectos fijos en el Modelo 3. ¿Son Modelo 1 y Modelo 2 mejores o incorrectos?

4voto

Bruce ONeel Puntos 391
>  Modelo 1 = lmer(Y ~ X + IndustryProfitability + CountryRiskRatings, myData)

Este no es un modelo de efectos mixtos y no se ejecutará. Devolverá un error:

Error: No se han especificado términos de efectos aleatorios en la fórmula

Luego tenemos:

>  Modelo 2 = lmer(Y ~ X + (1|Industry)+ (1|Country), myData)   

Esto ajustará un modelo de efectos mixtos lineal y, sujeto a convergencia, estimará el efecto fijo de X teniendo en cuenta la falta de independencia de las observaciones dentro de los clusters. Sin embargo, obviamente no se ajustará para IndustryProfitability o CountryRiskRatings que es el punto del OP.

Entonces podemos descartar los modelos 1 y 2.

Esto deja:

>  Modelo 3 = lmer(Y ~ X + (1|Industry)+ (1|Country) + IndustryProfitability + CountryRiskRatings, myData)

De hecho, esto ajustará por los 2 covariables. El hecho de que varíen a nivel de cluster no importa, deberían ser manejados automáticamente en el nivel correcto. Sin embargo, aconsejo un poco de precaución aquí. Si los 2 covariables son una causa, o un proxy de una causa, tanto de X como de Y, y ninguno es causa del otro, entonces son posibles factores de confusión y deberían ajustarse. Sin embargo, si alguno de ellos está en el camino causal de X a Y, entonces son mediadores y no deben ajustarse si su modelo se va a utilizar para inferencia; si es un modelo predictivo, esto no es tan importante.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X