8 votos

Diferencias de base en el RCT: Que las variables (si la hubiera) deberá ser incluyeron como covariables?

Recientemente he terminado un estudio mediante el cual se me asignó aleatoriamente a los participantes a uno de los dos grupos de tratamiento. He probado los participantes al inicio, inmediatamente después de la intervención, 1 meses, y 4 meses en un poco de la gran cantidad de variables de resultado. Yo estaba pensando en funcionamiento varios mixto de análisis de la varianza para examinar grupo x momento de interacciones. Algunas de las comparaciones será de 2 (grupo) x 2 (tiempo: línea de base y después de la intervención) comparaciones, y algunos serán 2 (grupo) x 3 (tiempo: línea de base, 1 mes, 4 meses) comparaciones.

Antes de comenzar mi análisis, he comparado los dos grupos de tratamiento en todas las variables de referencia. He encontrado que los grupos difieren en 4 línea de base de las variables si puedo usar un nivel alfa de .05 o 2 línea base de las variables si puedo usar un nivel alfa de .01 a comparar los grupos.

Tengo dos preguntas al respecto:

  1. ¿Qué nivel alfa debo utilizar para comparar los grupos en línea de base? Yo estaba pensando en un nivel alfa de .01 porque soy comparando los dos grupos en 24 de las características basales y yo pensé que debería eligió más estrictas a nivel alfa de .05 a reducir familia de sabios de la tasa de error de ver como un gran número de pruebas son se realiza, pero a partir de mis lecturas parece que la mayoría de la gente usa .05. ¿Qué recomienda usted?

  2. ¿Qué debo hacer acerca de estas diferencias? Podría incluir estos variables como covariables, pero a mi el tamaño de la muestra es muy pequeña y el uso de 4 covariables no parece apropiada (que también es en parte por qué me estoy favoreciendo sólo aceptando las diferencias si son significativos en el nivel de .05)

Cualquier ayuda sería muy apreciada!

8voto

dan90266 Puntos 609

Como Stephen Senn ha escrito, no es apropiado comparar la línea base de las distribuciones en un estudio aleatorizado. La forma en que me gusta hablar de esto es hacer la pregunta "¿a dónde parar?", es decir, cómo muchas otras covariables basales debe volver atrás y tratar de recuperar? Encontrarás contador de equilibrio de las covariables, si usted busca lo suficiente.

La base para elegir un modelo no es post-hoc de las diferencias, sino más bien apriori el conocimiento de la materia acerca de cuáles son las variables que pueden ser importantes predictores de la variable de respuesta. La versión básica de la variable de respuesta es sin duda un dominador predictor pero hay otros que tienden a ser importante. El objetivo es explicar explicable por la heterogeneidad en los resultados de maximizar la precisión y potencia. No hay casi ningún papel para pruebas de significación estadística en la formulación del modelo.

Un pre-especificado modelo se encargará de oportunidad de las diferencias en las variables que importa - aquellos predecir el resultado.

3voto

pauly Puntos 932

Normalmente lo que usted debe preocuparse acerca de la comparación de los dos grupos en la línea de base no es tanto la significación estadística de las diferencias pero el tamaño de las diferencias: es cualquiera de estas diferencias lo suficientemente grande como para materia para el estudio? Lo suficientemente grande como para afectar las comparaciones de grupos y variable de las relaciones que son el foco de la investigación? Suficientemente grande como para que el ajuste por ella (utilizando como covariable) es necesario?

Ahora, su caso es un poco más interesante en el que, incluso con asignación al azar, usted tiene 4 de las 24 variables que muestran diferencias significativas en el nivel de .05 (17% en lugar de la esperada 5%). Que puede parecer acerca de su proceso de aleatorización o algún otro aspecto del estudio. Pero en teoría, si la aleatorización se realiza a la perfección y no se desgaste en ambos grupos después, un resultado tan extremo o más, por lo que debe producirse el 2,4% del tiempo, basado en 24!/(4!(24-4)!) (.05^4) (.95^(24-4)). Que no es realmente un caso raro, después de todo. Lo tienes bien podría ser un juego de azar diferencias. Yo seguiría con el juicio basado en la magnitud de las diferencias.

2voto

Sean Hanley Puntos 2428

+1 a @FrankHarrell. Yo podría agregar un pequeño punto. Si usted asignados al azar a los participantes a los grupos, cualquier "significativo" las diferencias en los valores de la covariable antes de la intervención son necesariamente los errores de tipo I.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X