1 votos

Elección del modelo de regresión lineal para el conjunto de datos

Cuando se modela un modelo de regresión lineal para un conjunto de datos, hay tres opciones para las suposiciones sobre la influencia de los datos categóricos:

1: Asumir que no hay efecto de interacción. La pendiente de la regresión da como resultado $y = _0 + ... + _i*d $ . Pendientes paralelas, secciones Y variables.

2: Supongamos que existe un efecto de interacción. La pendiente de la regresión da como resultado $y = _0...+ _i(d*x)$ . La misma intersección y. Diferentes pendientes según la presencia de la variable ficticia.

3: $y = _0 + ... + _i(d+d*x)$ . Variación de las intersecciones Y y de las pendientes.

Los efectos de interacción podrían descubrirse con un análisis ANOVA, pero ¿cuándo debe utilizarse el tercer modelo?

2voto

Repmat Puntos 1118

Debería utilizar la tercera opción, siempre que piense que es posible que un determinado grupo comience en un nivel diferente al de los otros grupos, y que se desarrolle/crezca con diferentes pendientes.

Por ejemplo, ser negro (color de piel) puede suponer un salario más bajo que ser blanco en, digamos, 1970. Sin embargo, con el paso del tiempo el salario de ambos grupos crecerá, y una hipótesis que se suele encontrar es que la evolución salarial de los blancos y los negros desde 1970, hasta hoy, no es la misma. En este caso, se necesitan diferentes interceptos Y diferentes pendientes

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X