2 votos

¿Y si hay factores de confusión desconocidos en los modelos causales?

Modelos causales observacionales como bosque causal y aprendizaje automático ortogonal/doble requiere el supuesto de ausencia de confusión, es decir, que no haya factores de confusión ocultos que afecten tanto a los tratamientos como a los resultados. En mi opinión, se trata de una suposición difícil de cumplir en el mundo real. Creo que lo mejor que se puede afirmar es que "a nuestro leal saber y entender, no hay ningún otro factor de confusión" y que con el tiempo casi siempre aparecerán factores ocultos sorprendentes.

  1. ¿Cómo se comportarían estos modelos si hubiera factores de confusión desconocidos y no contabilizados (que afectan tanto al tratamiento como al resultado)?
  2. ¿Y si hay factores desconocidos que afectan al tratamiento o al resultado, pero no a ambos?
  3. ¿Y si conocemos la posibilidad de que existan algunos factores pero no disponemos de datos observacionales reales sobre ellos y, por tanto, no podemos incorporarlos al modelo?

Todas las discusiones que he leído se limitan a enunciar el requisito de este supuesto sin profundizar en el efecto de violarlo.

4voto

alexs77 Puntos 36

Un factor de confusión "desconocido" es una variable que se ha medido pero no se está seguro de la dirección de la causalidad: ¿un mediador retardado es realmente un factor de confusión? ¿El historial de uso de anticonceptivos confunde o media la relación causal entre la edad materna en el momento de la concepción y la incidencia de preeclampsia? Lamentablemente, lo que he observado en la literatura es que muchos autores ajustan el modelo "en ambos sentidos" y, si el "factor de confusión" cambia seriamente la estimación, declaran que ese modelo es el correcto. Hay muchas razones por las que esto no funciona: se puede excluir cualitativamente que esa variable sea un factor de confusión o un mediador, pero aceptarla como factor de confusión por el resultado cuantitativo es un enfoque incoherente de la evaluación. Además, los modelos logísticos son propensos a cambiar las estimaciones de las covariables cuando se añaden variables, incluso cuando no están relacionadas con el predictor principal, una característica denominada no colapsabilidad.

Usted parece estar hablando de un medido confusores, lo que significa que en realidad no tiene la variable (y realmente le gustaría tenerla) en el conjunto de datos de su análisis.

Mi experiencia práctica en este asunto es que es muy subjetivo. Desde el punto de vista de la redacción de un artículo o de una subvención, basta con señalar que se trata de una limitación y ofrecer una visión general del problema: ¿hizo otros ¿los estudios se ajustan a este valor? ¿qué es un proyección razonable sobre el impacto en los análisis? ¿Cómo podrían otros basarse en su trabajo en el futuro para tener en cuenta los datos que usted no obtuvo?

También nos preocupan los factores de confusión GRANDES frente a los pequeños. Un factor de confusión "grande" es (aproximadamente) altamente predictivo de la respuesta y altamente correlacionado con la respuesta condicionada a otras variables en el modelo. Este tipo de debate pretende implicar más a los expertos en contenido que a los estadísticos. Creo que la perspectiva razonable de un estadístico es que no se puede ajustar teóricamente por todos valores de confusión, por lo que los estudios observacionales deben tomarse con cautela. La creencia en los resultados se refuerza con la confirmación independiente de los mismos y con intervenciones basadas en los resultados que proporcionen una inversión esperada de la tendencia en el resultado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X