10 votos

¿Cuál es la relación entre métodos, como correspondencia y controlar estadísticamente las variables?

A menudo en artículos de investigación de leer los investigadores han controlado por ciertas variables. Esto se puede hacer por métodos tales como la coincidencia, bloqueo, etc.

Pero yo siempre pensé que el control de las variables fue algo que se hace estadísticamente mediante la medición de diversas variables que podrían ser de influencia y la realización de algunos análisis estadísticos en los que se podría hacer en verdadero y cuasi experimentos. Así, por ejemplo, tendría una encuesta o cualquier otra prueba en la que el youd medir la variable independiente y algunos posiblemente de las variables de confusión y realizar algunos análisis.

  • Es posible el control de las variables de cuasi experimentos?
  • ¿Cuál es el vínculo entre la aplicación de métodos tales como la coincidencia y controlar estadísticamente las variables?

6voto

Brettski Puntos 5485

Como con AdamO, creo que la clave para responder a esta pregunta es la noción de inferencia causal, y cómo llegar a "hacia" un modelo causal mediante observación de las configuraciones.

En un mundo perfecto, tendríamos algo que se llama un contrafactual de la población - la población de estudio, idéntico en todos los aspectos, excepto por la única cosa que nos interesa. La diferencia entre esas dos poblaciones, en función de esa diferencia, es una verdadera causal del resultado.

Obviamente, nosotros no podemos tener esto.

Sin embargo, hay formas para tratar de acercarse a él:

  • Aleatorización: Esta teoría (si la aleatorización se realiza correctamente) debe darle dos poblaciones son idénticas, excepto para el tratamiento post-aleatorización.

  • Estratificación: Se puede ver en una población dentro de los niveles de las covariables, donde se están haciendo "igual a igual" comparaciones. Esto funciona de maravilla para un pequeño número de niveles, pero rápidamente se vuelve engorroso.

  • Coincidencia: la comparación es un intento de montar un estudio de población tal que el Grupo a se asemeja a la del Grupo B, y por lo tanto es susceptible de comparación.

  • Estadísticos de ajuste: Incluyendo las covariables en un modelo de regresión permite la estimación de un efecto dentro de los niveles de las variables de control - de nuevo, la comparación de igual a igual, o al menos intentar.

Todos son un intento de acercarse a ese hipotético de la población. Cómo llegar a depende de lo que quieres obtener, y lo que su estudio se ve como.

2voto

James Sutherland Puntos 2033

La historia sobre la relación entre la coincidencia de regresión y se resumió en un post en el blog aquí. En breve

"En detrimento de los D [un tratamiento indicador de] un completo conjunto de dummies (es decir, saturado) para el modelo de X [variables]. La estimación resultante del efecto de D es igual a la coincidencia en X, y la ponderación a través de covariables de las células por la variación de tratamiento condicional en X"

Véase también la sección 3.3 de la Mayoría Inofensivos Econometría o la sección 5.3 de Hipótesis e Inferencia Causal para una discusión más completa, incluyendo los pros y los contras de la D dado X ponderación de la regresión implícitamente proporciona.

@EpiGrad da un buen comienzo en su primera pregunta. Los libros vinculados por encima de lo tratan casi exclusivamente. Si usted no tiene una computadora de ciencias / matemáticas fondo se puede encontrar la Perla difícil ir (aunque vale la pena en el final!)

2voto

alexs77 Puntos 36

Creo que de modelos causales es la clave para responder a esta pregunta. Uno se enfrenta desde el principio para identificar correctamente ajustado/estratificado/controlado el efecto de interés antes de siquiera mirar los datos. Si yo fuera a la estimación de la altura, la capacidad pulmonar de relación en los adultos, me gustaría ajustar el tabaquismo, ya que el fumar impide el crecimiento y las influencias de la capacidad pulmonar. Los factores de confusión son las variables que están causalmente relacionadas con el predictor de interés y se asocian con el resultado de interés. Ver la Causalidad de Judea Pearl, 2ª ed. Uno debe especificar y el poder de su análisis para la correcta variables de confusión antes de que el proceso de recolección de datos, incluso empieza a utilizar la lógica racional y el conocimiento previo de los anteriores estudios exploratorios.

Esto no significa, sin embargo, que algunos investigadores no dependen de data-driven métodos para seleccionar el ajuste de variables. No estoy de acuerdo con hacer esto en la práctica, cuando la realización de análisis confirmatorio. Algunas técnicas comunes en la selección de modelo para varios modelos ajustados se adelante/atrás el modelo de selección donde se puede restringir a las clases de modelos que crees ser, al menos, plausible. La caja negra de la AIC criterios de selección para esto está relacionado con la probabilidad y, por lo tanto, el grado de reducción en el $R^2$ para modelos lineales de estas ajuste de variables. Otro proceso común en epidemiología es donde las variables se añaden a la modelo si cambian la estimación del efecto principal (como una odds ratio o razón de riesgo) a menos del 10%. Mientras que esto es "más" correctos que los AIC modelo basado en la selección, creo que hay importantes advertencias en este enfoque.

Mi recomendación es prespecify el análisis deseado como parte de una hipótesis. La edad ajustada de fumar, el riesgo de cáncer es un parámetro diferente, y conduce a los diferentes inferencia en un estudio controlado que el crudo de fumar, el riesgo de cáncer. Mediante el conocimiento de la materia es la mejor manera de seleccionar los predictores de ajuste en el análisis de regresión, o como la estratificación, la correspondencia, o la ponderación de las variables en los diversos tipos de "controlar" los análisis experimentales y cuasi-experimentales de diseño.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X