Tengo un protocolo de medición que busca caracterizar la sensibilidad visual de un sujeto. Me gustaría evaluar el grado de fiabilidad de las mediciones de este procedimiento.
He medido un número pequeño de sujetos, con dos mediciones repetidas por día para un número de días (no todos los sujetos con el mismo número de días). Los datos son similares en forma a este (código R):
# generate some example data:
dat <- expand.grid(subject=1:4,rep=c(1,2),day=seq(0,28,by=4))
# extra subject with more days:
d <- expand.grid(subject=5,rep=c(1,2),day=seq(0,36,by=4))
dat <- rbind(dat,d)
dat$subject <- factor(dat$subject)
dat$y <- rnorm(nrow(dat),mean=3,sd=0.25)
que produce algunos de los datos cuyo resumen se parece a:
subject rep day y
1:16 Min. :1.0 Min. : 0.00 Min. :2.455
2:16 1st Qu.:1.0 1st Qu.: 8.00 1st Qu.:2.817
3:16 Median :1.5 Median :16.00 Median :2.970
4:16 Mean :1.5 Mean :14.95 Mean :2.978
5:20 3rd Qu.:2.0 3rd Qu.:24.00 3rd Qu.:3.141
Max. :2.0 Max. :36.00 Max. :3.617
El valor de medición es la relación de escala. Día es relativa a la de otros días de prueba dentro de un sujeto (es decir, no todos los sujetos del día "N" corresponde al mismo día de la prueba).
Una simple medida de la consistencia es correlacionar las puntuaciones dentro de un día - un simple test-retest de la medición. Sin embargo, esto no es útil utilizar la información que el mismo tema se repite la medición a través de días. Otra de las medidas que yo consideraba era una autocorrelación de las mediciones en función del tiempo, pero esto es extremadamente ruidoso debido a que no todos los sujetos con el mismo número de días, por lo que se debe hacer para cada sujeto.
Yo también modelado de los datos utilizando un modelo lineal con "días" y "rep" como continua predictores, en un marco jerárquico Bayesiano. Esto muestra que la pendiente para el día y la pendiente de la repetición dentro de un día no son creíble diferente de cero. Esto indica que los resultados son bastante estables a lo largo de días y repeticiones.
Sin embargo, una cosa que me gustaría ser capaz de hacer es comparar directamente la varianza entre los sujetos con la varianza dentro de un día o en días dentro de los temas. Es decir, para probar si la variabilidad de la medición de error de + dentro de los sujetos a las fluctuaciones es menor que la variabilidad normal de la sensibilidad visual a través de individuos.
¿Alguien tiene alguna sugerencia de cómo este modelo?