Processing math: 100%

11 votos

¿Usar variables de control en experimentos?

¿Por qué alguien querría controlar cualquier número de covariables basales en una situación donde la asignación al grupo de tratamiento es aleatoria?

Entiendo que asignar aleatoriamente el tratamiento debería hacer que la variable de tratamiento sea estrictamente exógena, creando un grupo de control que puede considerarse adecuadamente como un contrafactual. La única excepción que se me ocurre es cuando los tamaños de muestra son pequeños y esa asignación aleatoria puede seguir produciendo grupos desequilibrados.

Cualquier pensamiento es muy apreciado. ¡Gracias!

13voto

Neal Puntos 316

Si el resultado depende del tratamiento, así como de otros factores observables, el control de estos últimos a menudo mejora la precisión de la estimación del impacto (es decir, el error estándar del efecto del tratamiento será más pequeño). Cuando el tamaño de la muestra es pequeño, esto puede ser útil.

Aquí hay una simulación simple en la que, aunque el tratamiento es aleatorio, el error estándar se reduce en un tercio:

. set obs 100
obs eran 0, ahora 100

. gen treat =mod(_n,2)

. gen x=rnormal()

. gen y = 2 + 3*treat + 1*x + rnormal()

. reg y treat

      Source |       SS       gl       MS              Número de obs =     100
-------------+------------------------------           F(  1,    98) =  112.75
       Modelo |  209.354021     1  209.354021           Prob > F      =  0.0000
    Residual |  181.973854    98  1.85687606           R-cuadrado     =  0.5350
-------------+------------------------------           R-cuadrado ajustado =  0.5302
       Total |  391.327875    99  3.95280682           Raíz MSE      =  1.3627

------------------------------------------------------------------------------
           y |      Coef.  Error estándar      t    P>|t|     [Intervalo de confianza del 95%]
-------------+----------------------------------------------------------------
       treat |   2.893814   .2725345    10.62   0.000     2.352978     3.43465
       _cons |   2.051611    .192711    10.65   0.000     1.669183     2.43404
------------------------------------------------------------------------------

. reg y treat x

      Source |       SS       gl       MS              Número de obs =     100
-------------+------------------------------           F(  2,    97) =  180.50
       Modelo |  308.447668     2  154.223834           Prob > F      =  0.0000
    Residual |  82.8802074    97  .854435127           R-cuadrado     =  0.7882
-------------+------------------------------           R-cuadrado ajustado =  0.7838
       Total |  391.327875    99  3.95280682           Raíz MSE      =  .92436

------------------------------------------------------------------------------
           y |      Coef.  Error estándar      t    P>|t|     [Intervalo de confianza del 95%]
-------------+----------------------------------------------------------------
       treat |   2.918349   .1848854    15.78   0.000     2.551403    3.285295
           x |   1.058636   .0983022    10.77   0.000     .8635335    1.253739
       _cons |   1.996209    .130825    15.26   0.000     1.736558     2.25586
------------------------------------------------------------------------------

1 votos

+1: Otra razón es identificar los efectos de interacción con el tratamiento, pero eso va más allá de simplemente "controlar" otros factores como mencionó el OP.

0 votos

¡Gracias! Entonces, si uno o más covariables afectan el resultado que estás tratando de medir, incluirlos en tu modelo mejorará la precisión de tu estimación del efecto del tratamiento asignado al azar, pero realmente no afectará tu estimación del valor del coeficiente de tratamiento, ¿correcto?

0 votos

Sí, así es.

7voto

Robert Puntos 1

Desde una perspectiva frecuentista, una comparación no ajustada basada en la distribución de permutación siempre puede justificarse siguiendo un estudio (adecuadamente) aleatorizado. Una justificación similar puede hacerse para la inferencia basada en distribuciones paramétricas comunes (por ejemplo, la distribución t o la distribución $F) debido a su similitud con la distribución de permutación. De hecho, ajustar por covariables, cuando se seleccionan basadas en análisis post hoc, realmente corre el riesgo de inflar el error de Tipo I. Tenga en cuenta que esta justificación no tiene nada que ver con el grado de equilibrio en la muestra observada, o con el tamaño de la muestra (excepto que para muestras pequeñas la distribución de permutación será más discreta, y menos bien aproximada por las distribuciones t o $F).

Dicho esto, muchas personas son conscientes de que ajustar por covariables puede aumentar la precisión en el modelo lineal. Específicamente, ajustar por covariables aumenta la precisión del efecto del tratamiento estimado cuando son predictivos del resultado y no están correlacionados con la variable de tratamiento (como es cierto en el caso de un estudio aleatorizado). Sin embargo, lo que es menos conocido es que esto no se transfiere automáticamente a modelos no lineales. Por ejemplo, Robinson and Jewell [1] muestran que en el caso de la regresión logística, controlar por covariables Reduce la precisión del efecto del tratamiento estimado, incluso cuando son predictivas del resultado. Sin embargo, debido a que el efecto del tratamiento estimado también es mayor en el modelo ajustado, controlar por covariables predictivas del resultado Lo hace aumentar la eficiencia al probar la hipótesis nula de que no hay efecto de tratamiento después de un estudio aleatorizado.

[1] L. D. Robinson y N. P. Jewell. Algunos resultados sorprendentes sobre el ajuste de covariables en modelos de regresión logística. International Statistical Review, 58(2):227-40, 1991.

0 votos

Hola - respuesta interesante. ¿Te gustaría tener una conversación fuera de línea sobre esto?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X