Actualización (10 de septiembre de 2013) : Creo que sería más correcto decir que el aumento de las mediciones de la línea de base o de la línea final son formas de disminuir el efecto del diseño, haciendo así que el diseño del SW sea eficiente, en lugar de afirmar que el número máximo de mediciones es necesario. Woertman et al. (2013) .
El diseño de cuña escalonada ( pdf ) es una buena alternativa a los diseños de grupos paralelos cuando, por razones logísticas, la intervención debe desarrollarse por etapas. Sin embargo, un posible inconveniente de este diseño puede ser el número de rondas de medición. Aunque los diseños de SW pueden tener una mayor potencia (reduciendo así el tamaño de la muestra necesaria para detectar el mismo efecto), cada unidad se observa/mede antes y después de cada ronda de tratamiento (paso). Si tiene cinco pasos, hay seis rondas de medición, incluida la ronda de medición inicial cuando todas las unidades están en el grupo de control. Por tanto, si tiene n=1000, son 1000 x 6 = 6000 observaciones/mediciones.
Te escribo para preguntarte por una posible alternativa (ver imagen de abajo):
- Estratificar por comunidad (digamos 5 comunidades en general; aumentar a N = 1500 porque el diseño tiene menos poder que el SW)
- Aleatorizar los estratos (comunidades) según el orden de intervención (primero, segundo, tercero, cuarto, quinto)
- Dentro del primer estrato de la comunidad, la Comunidad A, realice encuestas de referencia con todos los n=300 y luego asigne aleatoriamente las unidades al tratamiento o al control
- Entregar la intervención a n/2 unidades aleatorizadas al tratamiento
- Realización de la encuesta final con todos los n=300 de la Comunidad A (tratamiento y lista de espera de control)
- Llevar a cabo una encuesta de referencia con todos los n=300 de la Comunidad B (podría ser al mismo tiempo que el nº 5) y luego asignar aleatoriamente las unidades al tratamiento o al control
- Entregar la intervención a n/2 unidades de la Comunidad B aleatorizadas al tratamiento Y a n/2 unidades de control en lista de espera de la Comunidad A (opcional, pero esto es lo que haríamos)
- Repite.
En el diseño alternativo, cada unidad es encuestada dos veces, sólo que en momentos diferentes. Con una muestra total de n=1500, esto supone 1500 x 2 = 3000 encuestas. En comparación con el diseño del SW, esto supone 6000 - 3000 = 3000 encuestas menos, lo que tiene grandes implicaciones en cuanto a costes.
El SW funciona porque observamos cada unidad antes y después de cada paso y luego modelamos el tiempo.
En el diseño alternativo, sólo tenemos 2 mediciones (línea de base y línea final) para cada unidad asignada al tratamiento (n=750) y al control en lista de espera (n=750).
En alternativa:
- Línea de base para la Comunidad A realizada en el mes 1
- Línea final para la Comunidad A realizada en el mes 3
- Línea de base para la Comunidad B realizada en el mes 3
- Línea final de la Comunidad B realizada en el mes 6
- Línea de base para la Comunidad C realizada en el mes 6
- Línea final de la Comunidad C realizada en el mes 9
- Línea de base para la Comunidad D realizada en el mes 9
- Línea final de la Comunidad D realizada en el mes 12
- Línea de base para la Comunidad E realizada en el mes 12
- Línea final de la Comunidad E realizada en el mes 15
- (no mediría el post-tratamiento para el control de la lista de espera de la Comunidad E; sólo entregaría el programa)
En el diseño alternativo, ¿podemos tener en cuenta el hecho de que las observaciones se realizan en momentos diferentes? En SW, cada unidad se mide antes y después de cada ronda, lo que facilita la modelización de los efectos temporales.
¿Podríamos hacer una regresión de las VD de la línea final sobre la asignación al tratamiento (0/1), un vector de controles de la línea de base, variables ficticias para los estratos de la comunidad y el mes de medición de la línea final? ¿Hay mejores alternativas?
Suponiendo que haya una solución, ¿cómo pensar en las implicaciones para el poder?
Diseño alternativo:
0 votos
Sólo un pensamiento rápido: Me parece que se pierde el control sobre los factores temporales en el diseño que has esbozado. Por ejemplo, si el efecto difiere entre el grupo A y el B, ¿se trata de una variación natural o se debe a efectos históricos?
0 votos
Este efecto se equilibraría entre el tratamiento y el control, ya que hay una aleatorización en cada ronda, pero estás dando con la esencia de mi pregunta: cómo tener en cuenta de la mejor manera posible el hecho de que los puntos finales se miden en diferentes momentos.