1 votos

Desacuerdo entre ICC y prueba t emparejada

Estoy tratando de determinar si los valores obtenidos por un cálculo de algoritmo son sistemáticamente diferentes de los valores de criterio.

Los valores de criterio se obtienen mediante observación manual con 3 jueces diferentes. Los valores obtenidos son los siguientes:

judge1_count = [1456 1430 1471 3024 3802 4334 3812 4140 1089 1860 2201 1107 1134];
judge2_count = [1458 1427 1473 3023 3835 4350 3791 4129 1090 1867 2212 1115 1147];
judge3_count = [1452 1441 1473 3030 3845 4360 3820 4160 1074 1863 2216 1119 1139];

Cada columna representa una muestra independiente diferente de la cual los 3 jueces dan un recuento

Primero pruebo la confiabilidad entre evaluadores calculando ICC(2,1) (efecto aleatorio de dos vías, modelo único), lo que me da un valor de ICC de aproximadamente 0,99, lo cual tiene sentido simplemente observando qué tan cerca están los conteos para cada muestra.

Luego introduzco los conteos del algoritmo:

algo_count = [1434 1422 1453 2973 3688 4061 3703 4072 1018  1837 2180 1090 1116]

Y una vez más aplico ICC(2,1), dándome un ICC de nuevo alrededor de 0,99. Sin embargo, cuando aplico una prueba t emparejada del conteo del algoritmo y el conteo del criterio (donde el conteo del criterio se promedia a través de los 3 jueces por muestra), la hipótesis nula es rechazada (p = 0,0078), y por observación se puede ver que los conteos del algoritmo son sistemáticamente más pequeños que los conteos del criterio, por lo que esto tiene sentido.

Entonces, mi pregunta es si estos resultados son lógicos, o si he pasado por alto algo en cuanto a cómo aplico los ICC. Esta es la primera vez que los uso, por lo que dudo si he utilizado esta función correctamente. Para referencia, repetí la tarea tanto en MATLAB como en R y obtuve los mismos valores de ICC.

2voto

Kirsten Puntos 11

Gracias por la aclaración en los comentarios. Intentaré elaborar un argumento para las diferencias.

Empecemos con las estadísticas de las pruebas t pareadas para ninguna diferencia en dos muestras, definida como

$t=\mu_d/s_d\sqrt(n)$

donde, $\mu_d$ es la media de la diferencia, $s_d$ es la desviación estándar de la diferencia y $n$ es el número de observaciones. Así, bajo el supuesto de que la diferencia sigue una distribución normal, obtenemos la estadística para la diferencia media.

El ICC(2,1) se basa en un modelo mixto lineal.

$y_{ij} = \alpha + b_i + u_{j} + \epsilon_{ij}$

donde $y_{ij}$ es el resultado observado para el sujeto $i$ por el juez $j$. El coeficiente $\alpha$ es la intercepción, $b_i$ es la varianza entre clúster para los sujetos, $u_j$ es la varianza entre clúster para los jueces y $\epsilon_{ij}$ es la variación adicional, no tomada en cuenta por los jueces o los individuos. Así, la correlación interclase se basa en un modelo mixto lineal, donde se espera que el resultado sea aproximadamente distribuido normalmente después de tomar en cuenta la variación de clúster (ya que los términos de error usualmente se asumen distribuidos normalmente, de hecho, se asume que el resultado es normalmente distribuido).

La correlación interclase es ahora la proporción de la variación explicada por las diferencias entre sujetos. Es decir,

$ICC(2,1)= b_i/(u_j+b_i+\epsilon_{ij})$

Así que si la mayoría de la variación se debe a diferencias entre sujetos, obtenemos un ICC alto.

Para relacionarlo con la prueba t. En la prueba t pareada solo consideramos la variación general, similar al modelo

$d_i = \alpha + \epsilon_{i}$

Entonces, la variación debida al juez y al individuo se considerará como variación no explicada. Eso significa que solo podemos ver una diferencia en las medias, no de dónde proviene la variación. En el ICC vemos que la mayoría de la variación se debe a diferencias individuales en los sujetos medidos, y no a diferencias en las mediciones de los jueces.

Así que tenemos dos estructuras de varianza completamente diferentes, y a menos que las variaciones individuales y de los jueces sean despreciables, no esperaríamos obtener resultados comparables.

Espero que esto aclare tu problema.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X