3 votos

¿Qué significa la expresión "ajustado por"?

"Emparejamiento de un grupo con exposiciones o resultados específicos con un de la investigación médica para investigar los efectos de la exposición. la asociación entre la exposición y el resultado". Ref

¿Significa que hay que incluir un factor en un modelo estadístico? Por ejemplo, ¿la frase
"La diferencia en el BodyMassIndex bajo el Factor (ajustado por sex y age ) entre el grupo de control y el grupo de tratamiento es estadísticamente significativo (valor t, P < 0,05)".
significa que un investigador consideró el siguiente modelo estadístico:
BodyMassIndex ~ Factor + age + sex + error ?
Con ello, el investigador asume implícitamente un número igual de participantes en ambos grupos (es decir, un diseño equilibrado).

En general, el investigador debe informar BodyMassIndex diferencia entre el grupo de control y el de tratamiento y mencionar que el efecto (principal) de Factor se ajustó por age y sex . En este caso, el diseño del estudio puede ser desequilibrado. En otras palabras, en tal caso "ajuste" significa incluir otros factores en el modelo. ¿Correcto?

Por otro lado, "ajuste" puede hacerse como "parte del diseño" y se denomina "coincidente" . En este caso, un sujeto del grupo de control y un sujeto del grupo de tratamiento son del mismo sexo y de la misma edad. En este caso supongo que sex y age los factores no se incluyen en un modelo y el diseño del estudio es equilibrado. ¿Correcto?

5voto

B.Liu Puntos 289

"Ajustado por" o "condicionado por" es una frase que puede significar muchas cosas diferentes, según el contexto. La Nueva Revolución Causal, dirigida por Judea Pearl y Donald Rubin, proporciona el mejor contexto para entender lo que realmente está pasando.

Lo que realmente ocurre son las variables de confusión. Una variable de confusión es una variable que establece un camino de puerta trasera desde la causa hasta el efecto. Dependiendo de las variables que ya se estén condicionando, es posible que haya que ajustar el factor de confusión por sí mismo o no. Véase el artículo de Pearl El Libro del Porqué ou Inferencia causal en estadística: A Primer para ver exactamente cuándo hay que ajustar o condicionar una variable. Spoiler: una variable correlacionada NO es necesariamente una variable de confusión, y "condicionar en el fregadero de la cocina" a veces puede conseguir una respuesta sesgada (incorrecta).

¿Cómo se ajusta o acondiciona? Hay múltiples formas de hacerlo:

  1. La primera, válida en un entorno de regresión, consiste simplemente en incluir la variable en el lado derecho del modelo.
  2. Válido en configuraciones más generales, puede estratificar su análisis por diferentes valores (o rangos de valores) de la variable. Esto funciona mejor si tiene un tamaño de muestra suficiente.
  3. En algunas circunstancias se puede utilizar la fórmula de ajuste por la puerta trasera (ver los libros de Pearl más arriba).
  4. En algunas circunstancias se puede utilizar la fórmula de ajuste de la puerta delantera (véase de nuevo los libros de Pearl).
  5. Se pueden utilizar variables instrumentales en algunas circunstancias.

Sin duda hay otras formas, pero estos son algunos de los métodos más comunes.

4voto

Joe Cannatti Puntos 2194

Voy a suponer, que en su ejemplo, Factor es el tratamiento, BodyMassIndex es el resultado, y usted está interesado en el efecto causal del tratamiento Factor sobre el resultado BodyMassIndex . Ya que se refiere a tratamiento y controlar grupos, supongo que el tratamiento Factor es binario. Así que el grupo de tratamiento son aquellas personas que han sido tratadas con Factor y el grupo de control son los que no lo han hecho.

Si se quiere conocer el efecto causal a partir de datos que no han sido creados con una aleatorización adecuada del tratamiento, hay que tener en cuenta los factores de confusión, ya que deben ser tratados especialmente en el análisis, de lo contrario, pueden arruinar los resultados. Los factores de confusión son variables que afectan causalmente a ambos tratamiento y resultados. En su ejemplo, age y sex son esos factores de confusión. Es decir, tienes las siguientes relaciones causales:

enter image description here

Este "tratamiento especial" de los factores de confusión se denomina "ajuste" o "control" de dichos factores ( age y sex ).

Esto es lo que podría ir mal con los confusores: Digamos que la variable de tratamiento es "estar conectado varias horas al día", y que mientras la mayoría de las personas mayores no lo hacen, casi todas las personas jóvenes sí. Además, supongamos que las personas más jóvenes tienen un mejor IMC. Así que tienes que age influye de forma causal tanto en el tratamiento como en los resultados . Y el resultado de su encuesta sería que estar conectado varias horas al día mejora el IMC.
Para evitar esas conclusiones erróneas, hay que "ajustar" por factores de confusión como age . Intuitivamente, una forma de ajustar es seleccionar un subconjunto de sus datos para los que, tanto en el grupo de tratamiento como en el de control, la distribución de la edad es la misma.

Pero hay varias formas posibles de ajustar los factores de confusión. Si se sabe que las relaciones entre las variables son aproximadamente lineales, se puede utilizar regresión lineal en la forma que mencionas, incluyendo todos los factores de confusión en el modelo, y luego el coeficiente de la variable de tratamiento ( Factor ) le da el efecto causal. Tenga en cuenta que este enfoque no no requieren un número igual de participantes en los dos grupos. No es necesario cambiar los datos. La regresión, "automáticamente", hace lo correcto si se incluyen todos los factores de confusión.

Otro enfoque para ajustar los factores de confusión es coincidiendo con . Esto es similar a la solución intuitiva descrita en el ejemplo anterior. Hay varias ventajas y desventajas del emparejamiento en comparación con el enfoque de regresión anterior, y se han escrito muchos libros y documentos para compararlas.
También suele ser beneficioso utilizar ambos métodos a la vez . Para este enfoque híbrido, software también está disponible.

Por último, el término "equilibrio" sólo se utiliza en relación con el emparejamiento y es una especie de indicador de calidad de sus resultados de emparejamiento. Se tiene un buen equilibrio si la distribución de todas las covariables en los grupos de tratamiento y de control es similar. Por ejemplo, en el ejemplo anterior, la proporción de personas jóvenes y mayores debería ser la misma en el tratamiento y en el control. Tenga en cuenta que esto no significa que el recuento total de los individuos debe ser el mismo en el tratamiento y en el control. Sólo necesitamos el proporción para ser similar.

1voto

db-inf Puntos 131

Recomendaría leer sobre un clásico de un solo sentido Modelo ANCOVA que potencialmente (con limitaciones obvias) se ajusta a este diseño de estudio:

  • una variable dependiente numérica,
  • un regresor categórico que nos interesa, y
  • dos regresores numéricos que no nos interesan (covariables).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X