A partir de la Epidemiología Moderna 3ª Edición por Rothman, Groenlandia y las Pestañas:
Hay al menos tres formas de overmatching. La primera se refiere a la coincidencia de que perjudica a la eficiencia estadística, tales como el control de casos coincidentes en una variable asociada con la exposición, pero no a la enfermedad. El segundo se refiere a la coincidencia de que perjudica a la validez, tales como la coincidencia en un intermedio entre la exposición y la enfermedad. La tercera se refiere a la coincidencia de que perjudica a la relación costo-eficacia.
La respuesta de AndyW es sobre la segunda forma de overmatching. Brevemente, he aquí cómo funcionan:
1: con el fin De ser un factor de confusión, uno de los criterios es que la covariable estar asociada con el resultado y la exposición. Si se asocian únicamente con uno de ellos, que no es un factor de confusión, y todo lo que he conseguido hacer es ampliar su intervalo de confianza.
Para explorar este tipo de overmatching además, considere la posibilidad de un igualado estudio caso-control de un binario de la exposición, con un control adaptado a cada caso en uno o más factores de confusión. De cada estrato en el análisis consistirá en un caso y un control menos algunos estratos pueden ser combinados. Si el caso y su correspondiente control son expuestas o ambos no expuestos, un margen de 2 x 2 de la tabla será de 0 ... un par de sujetos que no aporta ninguna información para el análisis. Si uno se estratifica en los correlatos de la exposición, uno va a aumentar la probabilidad de que dichas tablas se producen y por lo tanto tienden a aumentar la información que se pierde en el análisis estratificado.
2: Esto es parcialmente discutido por AndyW. La coincidencia en un intermedio factor de sesgo en la estimación, como se coincidentes en algo afectada por la exposición y el resultado. Este es esencialmente el control en una de hadrones, y cualquier técnica que lo hace sesgo de su estimación.
Si, sin embargo, el potencial de coincidencia factor se ve afectado por la exposición y el factor que a su vez afecta la enfermedad (es decir, es una variable intermedia), o se ve afectado tanto por la exposición y la enfermedad, entonces la coincidencia en el factor de sesgo, tanto el crudo y ajustado estimaciones del efecto. En estas situaciones, caso-control de coincidencia no es nada más que una irreparable forma de sesgo de selección.
3: Este es un estudio de diseño. Ampliamente coincidentes en las variables que no tienen que coincidir con en las razones 1 y 2 puede causar que usted rechazar fácilmente obtenidos de los controles (amigos, familiares, cercanos, red social, etc.) en favor de algo mucho más difícil de obtener de los controles que pueden ser comparadas en la innecesaria conjunto de covariables. Eso cuesta dinero, dinero que podría haberse gastado en más temas, lo mejor de la exposición o de la enfermedad de averiguación, etc., para no apreciable ganancia de sesgo o de precisión, y, de hecho, haber amenazado a ambos.