8 votos

Sesgo de sobreparejamiento y variables de confusión

Según tengo entendido, el emparejamiento es una forma de identificar la causalidad en los estudios observacionales. Al emparejar las observaciones que son "similares" y comparar las que recibieron o no recibieron tratamiento, se puede considerar como una especie de cuasi-experimento.

¿Qué es la sobrecoordinación? ¿Qué tipo de sesgo introduce? La mayoría de las veces he visto el emparejamiento desde una perspectiva económica, pero recientemente he visto algunos artículos sobre epidemiología que sugieren que el "sobreemparejamiento" puede dar lugar a un sesgo. Me resulta difícil entender la terminología de los artículos y agradecería mucho si alguien pudiera ayudar a explicar algunos de los conceptos principales. A continuación hay un artículo que hace referencia a la idea:

Un exceso de coincidencia puede provocar un sesgo. BMJ. 10 de agosto de 2002; 325(7359)

6voto

Judioo Puntos 625

Aunque yo también desconocía la terminología "over-matching", un ejemplo de la misma idea que he escuchado en la jerga económica y estadística podría ser el matching sobre un resultado "intermedio". Véanse los posts de Andrew Gelman sobre el tema

Este es el mismo problema que se describe al principio del artículo que citas ( Marsh y otros, 2002 )

Si la propia exposición conduce al factor de confusión, o tiene el mismo estatus de la enfermedad, entonces la estratificación por el factor de confusión también exposición, y la relación de la exposición con la enfermedad quedará enfermedad. Esto se denomina sobreparejamiento...

Gelman da un ejemplo conceptualmente claro en el post "Hacer hijos te hace más conservador". En términos sencillos (sin ejemplos) es que tienes tus direcciones causales al revés.

5voto

Brettski Puntos 5485

A partir de la Epidemiología Moderna 3ª Edición por Rothman, Groenlandia y las Pestañas:

Hay al menos tres formas de overmatching. La primera se refiere a la coincidencia de que perjudica a la eficiencia estadística, tales como el control de casos coincidentes en una variable asociada con la exposición, pero no a la enfermedad. El segundo se refiere a la coincidencia de que perjudica a la validez, tales como la coincidencia en un intermedio entre la exposición y la enfermedad. La tercera se refiere a la coincidencia de que perjudica a la relación costo-eficacia.

La respuesta de AndyW es sobre la segunda forma de overmatching. Brevemente, he aquí cómo funcionan:

1: con el fin De ser un factor de confusión, uno de los criterios es que la covariable estar asociada con el resultado y la exposición. Si se asocian únicamente con uno de ellos, que no es un factor de confusión, y todo lo que he conseguido hacer es ampliar su intervalo de confianza.

Para explorar este tipo de overmatching además, considere la posibilidad de un igualado estudio caso-control de un binario de la exposición, con un control adaptado a cada caso en uno o más factores de confusión. De cada estrato en el análisis consistirá en un caso y un control menos algunos estratos pueden ser combinados. Si el caso y su correspondiente control son expuestas o ambos no expuestos, un margen de 2 x 2 de la tabla será de 0 ... un par de sujetos que no aporta ninguna información para el análisis. Si uno se estratifica en los correlatos de la exposición, uno va a aumentar la probabilidad de que dichas tablas se producen y por lo tanto tienden a aumentar la información que se pierde en el análisis estratificado.

2: Esto es parcialmente discutido por AndyW. La coincidencia en un intermedio factor de sesgo en la estimación, como se coincidentes en algo afectada por la exposición y el resultado. Este es esencialmente el control en una de hadrones, y cualquier técnica que lo hace sesgo de su estimación.

Si, sin embargo, el potencial de coincidencia factor se ve afectado por la exposición y el factor que a su vez afecta la enfermedad (es decir, es una variable intermedia), o se ve afectado tanto por la exposición y la enfermedad, entonces la coincidencia en el factor de sesgo, tanto el crudo y ajustado estimaciones del efecto. En estas situaciones, caso-control de coincidencia no es nada más que una irreparable forma de sesgo de selección.

3: Este es un estudio de diseño. Ampliamente coincidentes en las variables que no tienen que coincidir con en las razones 1 y 2 puede causar que usted rechazar fácilmente obtenidos de los controles (amigos, familiares, cercanos, red social, etc.) en favor de algo mucho más difícil de obtener de los controles que pueden ser comparadas en la innecesaria conjunto de covariables. Eso cuesta dinero, dinero que podría haberse gastado en más temas, lo mejor de la exposición o de la enfermedad de averiguación, etc., para no apreciable ganancia de sesgo o de precisión, y, de hecho, haber amenazado a ambos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X