El control de algo y que ignorar algo que no son la misma cosa. Vamos a considerar un universo en el que sólo 3 existen variables: Y, X1, y X2. Queremos construir un modelo de regresión que predice Y, y estamos especialmente interesados en su relación con X1. Existen dos posibilidades.
- Podríamos evaluar la relación entre los X1 y Y, mientras que el control por X2:
Y=β0+β1X1+β2X2
o,
-
podríamos evaluar la relación entre los X1 y Y, mientras que ignorar X2:
Y=β0+β1X1
Por supuesto, estos son muy simples modelos, pero que constituyen diferentes maneras de ver cómo la relación entre los X1 y Y se manifiesta. A menudo, el estimado de ˆβ1s podrían ser similares en ambos modelos, pero que pueden ser muy diferentes. Lo que es más importante en la determinación de lo diferentes que son, es la relación (o falta de ella) entre X1 y X2. Considere la posibilidad de esta figura:
![enter image description here]()
En este escenario, X1 se correlaciona con X2. Desde la parcela es de dos dimensiones, es una especie de que ignora X2 (irónicamente), por lo que me han indicado los valores de X2 por cada punto con distintos símbolos y colores (el pseudo-3D gráfico siguiente proporciona otra forma de tratar de mostrar la estructura de los datos). Si queremos ajustar un modelo de regresión que ignora X2, obtendríamos el sólido negro de la línea de regresión. Si queremos ajustar un modelo que controla por X2, tendríamos un plano de regresión, que es de nuevo duro de la trama, así que tengo trazan tres rodajas a través de ese plano donde X2=1, X2=2, y X2=3. Así, tenemos las líneas que muestran la relación entre los X1 y Y que se mantienen cuando se nos de control para X2. De la nota, vemos que el control por X2 no produce una sola línea, sino un conjunto de líneas.
![enter image description here]()
Otra forma de pensar acerca de la distinción entre ignorar y control para la otra variable, es considerar la distinción entre una distribución marginal y condicional de distribución. Considere la posibilidad de esta figura:
![enter image description here]()
(Esto es tomado de mi respuesta a esta pregunta: ¿Qué es la intuición detrás condicional de distribución Gausiana?)
Si usted mira la curva normal dibujado a la izquierda de la figura principal, que es la marginal de la distribución de Y. Es la distribución de $$ Y si nos ignorar su relación con el valor de X. Dentro de la figura principal, hay dos curvas normales que representan condicional distribuciones de Y al X1=25 y X1=45. Las distribuciones condicionales de control para el nivel de X1, mientras que la distribución marginal ignora .