27 votos

¿Qué significa "todo lo demás igual" significa, en la regresión múltiple?

Cuando hacemos las regresiones múltiples y dicen que estamos buscando en el cambio promedio en la yy variable para un cambio en una x variable, manteniendo todas las otras variables constantes, ¿qué valores estamos manteniendo las otras variables se mantiene constante? Su media? Cero? Cualquier valor?

Estoy inclinado a pensar que en cualquier valor; sólo en busca de una aclaración. Si alguien tenía una prueba, que sería demasiado grande.

38voto

Sean Hanley Puntos 2428

Estás en lo correcto. Técnicamente, es de ningún valor. Sin embargo, cuando enseño este que les digo a las personas que usted está consiguiendo el efecto de un cambio de unidad en Xj cuando todas las otras variables se llevan a cabo en sus respectivos medios. Creo que esta es una forma común de explicar que no es específico para mí.

Normalmente voy a mencionar que si usted no tiene ningún interacciones medicamentosas, βj será el efecto de un cambio de unidad en Xj, no importa lo que los valores de las otras variables. Pero me gustaría comenzar con la media de la formulación. La razón es que hay dos efectos de la inclusión de múltiples variables en un modelo de regresión. En primer lugar, el efecto de Xj el control de las otras variables (véase mi respuesta aquí). La segunda es que la presencia de las otras variables (normalmente) se reduce la varianza residual del modelo, haciendo las variables (incluyendo Xj) 'más importantes'. Es difícil para la gente a entender cómo funciona esto, si el resto de variables tienen valores que están por todo el lugar. Que parece que sería aumentar la variabilidad de alguna manera. Si usted piensa de ajuste de los datos de cada punto hacia arriba o hacia abajo el valor de la otra variable hasta que todo el resto de la X variables han sido trasladados a sus respectivos medios, es fácil ver que el residual de la variabilidad se ha reducido.

No entiendo a las interacciones hasta una clase o dos después de que haya introducido los conceptos básicos de la regresión múltiple. Sin embargo, cuando me pongo a ellos, yo regreso a este material. Lo anterior se aplica cuando no son las interacciones. Cuando hay interacciones, es más complicado. En ese caso, la interacción de la variable[s] se mantiene constante (muy particular) en 0, y en ningún otro valor.

Si quieres ver cómo esto se desempeña de manera algebraica, es bastante sencillo. Se puede empezar con la no-interacción caso. Vamos a determinar el cambio en ˆY cuando todas las otras variables se mantiene constante en sus respectivos medios. Sin pérdida de generalidad, supongamos que hay tres X variables y estamos interesados en la comprensión de cómo el cambio en ˆY está asociado con una unidad de cambio en X3, manteniendo X1 X2 constante en sus respectivos medios:

ˆYi=ˆβ0+ˆβ1ˉX1+ˆβ2ˉX2+ˆβ3X3iˆYi=ˆβ0+ˆβ1ˉX1+ˆβ2ˉX2+ˆβ3(X3i+1) subtracting the first equation from the second: ˆYiˆYi=ˆβ0ˆβ0+ˆβ1ˉX1ˆβ1ˉX1+ˆβ2ˉX2ˆβ2ˉX2+ˆβ3(X3i+1)ˆβ3X3iΔY=ˆβ3X3i+ˆβ3ˆβ3X3iΔY=ˆβ3

Ahora es obvio que le podría haber puesto cualquier valor en X1 X2 en las dos primeras ecuaciones, siempre ponemos el mismo valor para X1 (X2) en dos de ellos. Es decir, mientras estamos sosteniendo X1 X2 constante.

Por otro lado, no funciona de esta manera si usted tiene una interacción. Aquí os muestro el caso donde hay un X1X3 término de interacción:

ˆYi=ˆβ0+ˆβ1ˉX1+ˆβ2ˉX2+ˆβ3X3i +ˆβ4ˉX1X3iˆYi=ˆβ0+ˆβ1ˉX1+ˆβ2ˉX2+ˆβ3(X3i+1)+ˆβ4ˉX1(X3i+1) subtracting the first equation from the second: ˆYiˆYi=ˆβ0ˆβ0+ˆβ1ˉX1ˆβ1ˉX1+ˆβ2ˉX2ˆβ2ˉX2+ˆβ3(X3i+1)ˆβ3X3i+ ˆβ4ˉX1(X3i+1)ˆβ4ˉX1X3iΔY=ˆβ3X3i+ˆβ3ˆβ3X3i+ˆβ4ˉX1X3i+ˆβ4ˉX1ˆβ4ˉX1X3iΔY=ˆβ3+ˆβ4ˉX1

En este caso, no es posible mantener todo lo demás constante. Debido a que el término de interacción es una función de X1X3, no es posible el cambio de X3 sin el término de interacción cambiando también. Por lo tanto, ˆβ3 es igual a la variación en ˆY asociado con una unidad de cambio en X3 sólo cuando la interacción de la variable (X1) se mantiene en 0 en lugar de ˉX1 (o cualquier otro valor, sino 0), en cuyo caso el último término en la parte inferior de la ecuación de gotas.

En esta discusión, me he centrado en las interacciones, pero más en general, el problema es cuando hay alguna variable que está en función de otra que no es posible cambiar el valor de la primera sin cambiar el valor correspondiente de la otra variable. En tales casos, el significado de ˆβj se vuelve más complicado. Por ejemplo, si usted tenía un modelo con XjX2j, ˆβj es el derivado dYdXj manteniendo todo lo demás igual, y la celebración de Xj=0 (ver mi respuesta aquí). Otros, todavía más complicadas fórmulas también son posibles.

8voto

Eero Puntos 1612

La matemática es simple, solo hay que tomar la diferencia entre los 2 modelos con una de las variables x cambiado por 1 y verás que no importa lo que el resto de variables son (dado que no hay interacciones medicamentosas, polinomio, o de otras complicaciones términos).

Un ejemplo:

y[1]=b0+b1×x1+b2×x2

y[2]=b0+b1×(x1+1)+b2×x2

y[2]y[1]=b0b0+b1×x1b1×x1+b1×1+b2×x2b2×x2=b1

6voto

doug r Puntos 11

Creo que usted se refiere a la dependencia en el covariables (Xi). Así que si el modelo es Y=β0+β1X1+β2X2 el efecto de la Xi Y a igualdad de otras circunstancias serían ΔYΔXi cualquier ΔXi con todos los otros Xj mantiene constante en cualquier valor.

Tenga en cuenta que es posible que X1 X2 son dependientes (por ejemplo, las funciones de cada uno de los otros), sin que necesariamente muestran una interacción significativa en el modelo lineal ( β12=0 Y=β0+β1X1+β2X2+β12X1X2 ).

Así como una interesante tangente he aquí un ejemplo: Deje X1N(0,σ21)X2=X21+N(0,σ22), es evidente que cualquier cambio en X1 afectarán X2. Sin embargo, la covarianza entre los dos es cero. cov(X1,X2)=E(X1X2)E(X1)E(X2) =E[X1(X21+a)]E(X1).E(X21a)withaN(0,σ22) =E(X31)E(X1.a)0.E(X21a)=000=0

Así que, en realidad un cambio en X1 estaría asociado con un cambio en X2 y ΔYΔXi no cubriría lo que realmente ocurriría si se altera X1. Pero ΔYΔXi todavía sería descrito como el efecto de la Xi Y todas las cosas en igualdad de condiciones.

Esto es comparable a la diferencia entre un derivado y un parcial de derivados (el análogo de la ΔYΔXi) en una ecuación diferencial.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X