El error estándar de la variable de interés se puede calcular como
Como siempre, es la varianza del error de regresión y es el factor de inflación de la varianza de .
Si ahora se controla una segunda variable (que resulta ser muy significativa), se reducen inevitablemente los residuos lo que lleva a su vez a una reducción de . Porque no es un factor de confusión, se mantiene sin cambios. En definitiva, se hundiría.
Si mi pensamiento es correcto, entonces uno trataría de controlar en grandes conjuntos de datos (digamos, 100k observaciones) tantas variables de control altamente significativas como sea posible. Esto se debe a que la pérdida de grados de libertad es insignificante y la -El valor de la variable de interés baja.
El control de los no-confundidos parece ser una cuestión bastante importante para acertar en la estadística aplicada. Por lo tanto, me pregunto si mi argumento es correcto o si he entendido algo mal.
Mis mejores deseos, Tom