5 votos

Tamaño de la muestra ajustable en el ensayo clínico

La mayoría de los ensayos clínicos que veo tienen un tamaño de muestra fijo. En algunos casos tienen datos previos que permiten estimar el tamaño del efecto y la varianza o la distribución de los valores, y calcular el tamaño de la muestra a partir de eso para una determinada potencia. En otros casos se trata simplemente de una conjetura.

¿Por qué no se haría un ensayo clínico en el que se determinara el tamaño de la muestra durante ¿el juicio? (por ejemplo, aumentándolo hasta que el intervalo de confianza se reduzca a un tamaño determinado especificado de antemano) ¿Hay alguna razón por la que esto no sería un diseño válido? ¿Hay algún ejemplo de ensayos así, y alguna referencia para diseñar un ensayo así?

6voto

alexs77 Puntos 36

Idealmente, ese es el objetivo de un ensayo de fase II. Los resultados de estos estudios, a menudo de un solo brazo, se utilizan para calcular la potencia. A veces se experimenta con la dosificación y los criterios de elegibilidad; cuantas más partes móviles haya en un estudio de fase II, más se arriesgará un estudio de fase III.

Si un compuesto se muestra prometedor, un Comité de Supervisión de Datos podría recomendar que se aumente la inscripción o se reduzca adecuadamente. A veces se trata del riesgo de daño. Si un compuesto no tiene la potencia suficiente porque el efecto no es tan potente como se esperaba, el Comité de Seguimiento de Datos puede poner fin al estudio, ya que los sujetos del estudio, por el hecho de participar en él, se están exponiendo a un riesgo. Los estudios no pueden continuar a perpetuidad por una cuestión de ética.

De hecho, existe todo un campo de ensayos adaptativos secuenciales que permite a los investigadores pasar sin problemas de los estudios de fase II a los de fase III. El paquete de software estadístico SeqTrial en S+ de Scott Emerson permite realizar cálculos del tamaño de la muestra para una variedad de reglas de gasto alfa y tamaños del efecto.

La excesiva confianza en las estadísticas "tradicionales" de la FDA está bastante en contra, ya que puede afectar a la integridad de los resultados. En realidad, es un buen principio en este caso, y Tom Fleming se ha manifestado en contra en su artículo "Discerning Hype From Substance". Básicamente, cotejar los hallazgos de los estudios de fase II y fase III rara vez o nunca es apropiado, incluso cuando los protocolos son similares (idénticos) entre el II y el III. Esto se debe a que el estudio de fase III sólo se realizó porque la fase II parecía prometedora. Por lo tanto, el sesgo de selección afectará a la validez de esos resultados agregados.

0 votos

"puede afectar a la integridad de los hallazgos": entiendo el problema de las comparaciones múltiples, pero ¿no hay formas bien establecidas de controlar eso? En realidad, no estoy hablando de continuar un estudio hasta que obtenga un resultado significativo, sino hasta que la incertidumbre sobre el tamaño del resultado disminuya lo suficiente; esto no parecería verse tan afectado por las comparaciones múltiples.

0 votos

¿podría decirme también cuáles son los problemas de reputación/credibilidad (si es que hay alguno) con los juicios secuenciales? ¿La mayoría de la gente considera que un ensayo secuencial bien diseñado y realizado es una prueba sólida? ¿La gente no suele hacerlo porque es demasiado complicado o porque no es lo suficientemente creíble?

0 votos

Creo que si crees en el principio de máxima verosimilitud o en el bayesiano, el tamaño de muestra ajustable para un ensayo clínico está bien.

3voto

Cliff AB Puntos 3213

Creo que la respuesta de AdamO es genial, pero creo que también vale la pena destacar que este diseño de tamaño de muestra adaptable es ¿cuántos (tal vez la mayoría? He realizado trabajos teóricos durante las prácticas en empresas farmacéuticas, pero no puedo decir que haya planificado nunca un estudio real...) se realizan ensayos clínicos.

Es decir, si se utiliza un diseño secuencial, los pacientes iniciales son reclutados y tratados. A mitad del estudio, se analizan los datos recogidos en ese momento. En este punto pueden ocurrir tres acciones posibles: los datos pueden mostrar un resultado estadísticamente significativo y el estudio se detendrá porque se ha demostrado la eficacia, los datos muchos muestran estadísticamente que no hay un efecto fuerte (por ejemplo, el extremo superior del intervalo de confianza está por debajo de algún umbral clínicamente significativo) y el estudio se detiene debido a la futilidad o los datos aún no son concluyentes (es decir, tanto un efecto clínicamente significativo como un efecto clínicamente insignificante están contenidos en el intervalo de confianza) en el que se recogerán más datos. Así que puede ver que en este caso, el tamaño de la muestra es no arreglado.

Una nota importante sobre esto: no se puede ejecutar una prueba estándar cada vez que se "comprueban" los datos, ya que, de lo contrario, se están haciendo comparaciones múltiples. Debido a que las estadísticas de las pruebas en diferentes momentos deben estar correlacionadas positivamente, no es un problema tan grande como los problemas de comparación múltiple estándar, pero aún así debe ser abordado para una inferencia adecuada. Los ensayos clínicos, al estar regulados por la FDA, deben declarar un plan sobre cómo abordarán esto (como señala @AdamO, SeqTrial proporciona software para esto). Sin embargo, muchas veces los investigadores académicos, al no estar regulados por la FDA, seguirán recogiendo datos hasta que encuentren significación sin ajustar el hecho de que están haciendo varias comparaciones. No es el mayor abuso de la práctica estadística en la investigación, pero sigue siendo un abuso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X