8 votos

¿Cuál es el mejor método para reportar múltiples pruebas de equivalencia?

Estoy haciendo un estudio en el que se involucran múltiples pruebas de equivalencia. Hay una tabla estándar para reportar tales resultados?

EDITAR con más detalle: Se trata de un estudio longitudinal con 5 puntos de tiempo. Nuestra hipótesis es que hay un cambio de la línea de base de 1 mes y, a continuación, la estabilidad después de eso. Inicialmente, pensé en un modelo multinivel pero no hay ninguna variable independiente que no sea el tiempo. Así que me decidí por pruebas t entre el basal y 1 mes y TOST pruebas de equivalencia entre 1 y 3 meses, 3 y 6, 6 y 9 y 9 y 12.

También hubo 5 áreas de la prueba.

Por lo tanto, necesito una manera de resumir todas estas pruebas en una tabla

7voto

GenericTypeTea Puntos 27689

La regresión de la tabla de presentaciones son bastante fácil de modificar para acomodar las pruebas de equivalencia, incluyendo la pertinencia de las pruebas-en el que basar las conclusiones de ambas pruebas por diferencia (pruebas de $H^{+}{0}$) y las pruebas de equivalencia (pruebas de $H^{^{-}}_{0}$). Por ejemplo (suponiendo que usted está presentando varias pruebas en un contexto de regresión, por lo tanto el $\beta$):

Presentation of TOST results

Usted puede presentar tanto una cara de la estadística de prueba ( $t_1$ $t_2$ ) y sus correspondientes p-valores ( $p_1$ $p_2$ ) de las pruebas de equivalencia, y además de presentar la prueba estadística de $t$ y el p-valor ($p$) para las pruebas de la diferencia.

Además es posible que desee incluir una columna para su definición de equivalencia si se varía de prueba para probar (yo uso $\Delta$ a indicar mi equivalencia/umbral de relevancia se define en unidades de mis medidas, y $\varepsilon$ a indicar que este umbral se define en unidades de mi estadístico de prueba). Si utiliza una constante definida de equivalencia/umbral de relevancia para todas las pruebas, es muy probable que indican que en una nota a pie de página de la tabla.

También puede facilitar la interpretación, incluyendo las columnas de articular expresamente el rechazo de las decisiones de la equivalencia y la diferencia de las pruebas. Incluyendo una prueba de pertinencia de la columna (la combinación de resultados como hemos ilustrado aquí) también puede facilitar la interpretación.

Por supuesto, también se puede utilizar este formato para presentar pruebas independientes, y presentar diferentes tipos de TOST de la estadística de prueba (por ejemplo, z de la estadística de prueba como los que se utilizan con pruebas no paramétricas, exacta prueba binomial estadísticas, etc.).

3voto

Matt Puntos 1371

Otros han dado más respuestas directas a tu pregunta, pero voy a intentar mostrar una solución diferente al problema. A menos que yo estoy entendiendo, parece como un camino de dos (período de área) modelo de efectos fijos que sería mejor trabajar (con una robusta SEs, por supuesto!). $$ y_i = \sum_k \alpha_k \times \mathbf{1}[i \en \text{período}_k] + \sum_j \beta_j \times \mathbf{1}[i \en \text{área}_j] + \epsilon_i $$

Usted podría hacer un test F (conjunto null test) en todas las $\alpha_k$ a ver si hay algún cambio a través del tiempo en absoluto, y usted puede hacer una prueba de Wald para ver si un subconjunto de los coeficientes (en su caso $\alpha_2 = \alpha_3 = \dots = \alpha_K$) son los mismos. Esto también recibe alrededor de todos los múltiples problemas de las pruebas debe ser tener que preocuparse si usted está haciendo un montón de pares de pruebas.

Todo lo anterior se puede hacer dentro del texto. Para una inspección visual.. yo sé que usted está pidiendo una tabla, pero creo que una trama como esta, con un 95% de intervalo es mucho más convincente. Pero tal vez es sólo el estilo de mi campo.

enter image description here

3voto

usεr11852 Puntos 5514

Creo que uno puede hacer todas estas múltiples pruebas de equivalencia dentro de una sola lineal-modelos mixtos. Dado que hay múltiples (2+) las medidas después de que el cambio tuvo lugar es bastante natural para presentar varias de estas pruebas como parte de una sola repetición de las mediciones de la modelo.

En particular, se puede definir el indicador variables entre los pasos sucesivos y, a continuación, comprobar su significado; en esencia, hace varios $t$-prueba en un-go. Creo que una al azar, con una estructura simple intercepto y de la pendiente para cada sujeto estaría bien. Yo no veo que la ausencia de las variables independientes de los otros que el tiempo como un problema estructural. Si algo creo que simplifica las cosas aún más.

Por lo que entiendo que dado un valor inicial(val0) algo que se lleva a cabo (step0) mientras da un paso desde el primer periodo de medición para el segundo. Para la posterior intra-medición de períodos de tiempo (step1, step2, step3) no pasa nada. El error de medición se supone constante. Por lo que uno tiene algo como esto:

Roughly simulated sample

Creo este ejemplo con el siguiente código:

set.seed(123)
sampleTimes <- seq(0,1, length.out = 5); 
N = 10^2;
val0 <- rnorm(N, mean = 0, sd = 5); # Starting values
slopeAt0 <- rnorm( N, mean = -10, sd = 5); # Effect kicks in
val1to5 <- val0 + slopeAt0 * diff(sampleTimes[1:2]) # so val0 is +2.5 higher

trueMeans <- cbind( val0, t(matrix(rep(val1to5,4), 4, byrow = TRUE)))
obsSample <- trueMeans + rnorm(N*5)
subject <- (1:N)
matplot(sampleTimes, t(obsSample),type = 'l', ylab= 'Obs. Sample') # Visualise   

Y definir una serie de variables indicadoras para los períodos de salir de un punto de medición a la siguiente. Aviso que yo no definir ningún "último paso" step4; no sabemos lo que sucede después de que el último punto de medición en $t_4$.

Q <- data.frame( t = rep(sampleTimes, times = N), 
                 ID = rep(subject, each = 5), reads = as.vector(t(obsSample)),
                 step0 = rep(c(1,0,0,0,0), times = N), 
                 step1 = rep(c(0,1,0,0,0), times = N),
                 step2 = rep(c(0,0,1,0,0), times = N), 
                 step3 = rep(c(0,0,0,1,0), times = N))

El uso de este diseño es una tarea relativamente sencilla para adaptarse a un LME y comprobar si el stepX variables se vuelven estadísticamente significativa. El intercepto y la pendiente de absorber cualquier tema con variaciones específicas y uno de bootstrap que el modelo directamente. También se puede utilizar el $t$-valores de la original de la LME.

library(lme4)
m1 <- lmer(reads ~ step0 + step1 + step2 + step3 + (t+1|ID), Q)
summary(m1)
confZ = confint(m1, method='boot', nsim= 1000)
print(confZ)
# Computing bootstrap confidence intervals ...
#                 2.5 %     97.5 %
# .sig01       3.7653500  5.0961341
# .sig02      -0.2043878  0.9843421
# .sig03       0.3396433  1.2702728
# .sigma       0.9869698  1.1579640
# (Intercept) -3.2169570 -1.2982469
# step0        2.5430254  3.2526163
# step1       -0.2465836  0.4475912
# step2       -0.0728649  0.5659132
# step3       -0.1625806  0.4023341

Los resultados son bastante razonables creo que, incluso por el modesto tamaño de la muestra ($N = 10^2$) que se utilizan. Querer estar en el lado seguro he incluido un azar de la pendiente y esta fue probablemente redundante (sig02) (la descripción original del problema no especifica que hay una variable en el tiempo la tendencia), pero excluyendo los que no altera los resultados básicos de cualquier manera: algo que sucede durante la step0 período.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X