3 votos

¿Correlación negativa entre d' y los índices de aciertos?

Tengo datos de una tarea relativamente fácil en la que los sujetos tenían que detectar una señal en el ruido. Calculé las tasas de aciertos y de falsas alarmas (HR, FAR), y luego procedí a calcular d' utilizando la fórmula estándar, encontrada por ejemplo en Green&Swets 1966, y descrita también aquí :

d' = z(FAR) – z(HR),

donde las puntuaciones z para los valores p de la cola izquierda de la distribución normal se calculan en Matlab como:

z(HR)  = norminv(1-HR, 0, 1)
z(FAR) = norminv(1-FAR, 0, 1).

Esto produjo todos los valores negativos para d', y sé que la práctica habitual es invertir el signo en la fórmula de d', para obtener valores positivos de d':

d' = z(HR) – z(FAR)

Como comprobación de la cordura, creé un gráfico de dispersión entre sujetos de los valores brutos de RH contra d', esperando encontrar una correlación positiva en general. Sin embargo, lo que encontré fue una correlación muy clara negativo correlación:

enter image description here

Sé que el valor p en las fórmulas anteriores para las puntuaciones z son tomadas por algunos no como 1-p sino simplemente como p por lo que volví a calcular z(HR) y z(FAR) como

z(HR)  = norminv(HR, 0, 1)
z(FAR) = norminv(FAR, 0, 1)

Para tener valores d' positivos, volví a su z(FAR)-z(HR) pero los valores y su gráfico acaban siendo los mismos que los de la captura de pantalla anterior.

Seguramente, suponiendo que las FAR sean moderadas en todos los casos, los sujetos con las HR más altas deberían tener también, en principio, los valores d' más altos. ¿Qué estoy confundiendo aquí?

REFERENCIA: Green, D. M., & Swets, J. A. (1966). Signal detection theory and psychophysics (Vol. 1). Wiley New York.


EDIT: Habiendo hecho más comprobaciones de cordura en los datos, el cálculo de los FARs era de hecho erróneo, y esto estaba llevando a la absurda correlación negativa descrita. Una vez arreglado esto, las fórmulas anteriores (con p en lugar de 1-p para norminv, y polaridad HR-FAR en lugar de FAR-HR) dan valores d' sensatos y una correlación positiva. También publicaré esta respuesta.

1voto

Palimondo Puntos 2337

Mi error. Después de hacer más comprobaciones de cordura en los datos, el cálculo de los FARs era de hecho erróneo, y esto llevaba a la absurda correlación negativa descrita. Una vez arreglado esto, las fórmulas anteriores (con p en lugar de 1-p para norminv, y polaridad HR-FAR en lugar de FAR-HR) dan valores d' sensatos y una correlación positiva.

1voto

user164061 Puntos 281

Se pueden trazar las curvas ROC. En el gráfico con la curva zROC el $d^\prime$ se refiere a la distancia entre la curva y la recta zTPR=zFPR.

Si las varianzas de las señales y del ruido son iguales, entonces la pendiente de la curva zROC es 1, y se obtiene una constante $d^\prime$ en función de la TPR. Pero se obtiene una pendiente diferente cuando las varianzas no son iguales.

Su correlación negativa entre TPR y $d^\prime$ significa que la pendiente de la curva zROC es <1.

example

TPR: tasa de verdaderos positivos o tasa de aciertos

FPR: tasa de falsos positivos o tasa de falsas alarmas

layout(matrix(1:9,3))

t = seq(-10,10,0.1)

FPR = rbinom(201,1000, p = 1 - pnorm(t,0,1))/1000
TPR = rbinom(201,1000, p = 1 - pnorm(t,2,2))/1000

plot( FPR,TPR )
lines(c(-10,10),c(-10,10), lty=2)

zFPR = qnorm(FPR)
zTPR = qnorm(TPR)

plot(zFPR, zTPR)
lines(c(-10,10),c(-10,10), lty=2)

dp = zTPR-zFPR
plot(dp,TPR)

Intuición: Las puntuaciones z de TPR y FPR cambian, cuando el nivel de activación de la declaración de una señal detectada cambia. Este cambio de las dos puntuaciones z puede ser a ritmos diferentes, y ese es el caso cuando la varianza de la señal y el ruido son diferentes. Si zFPR cae más rápido que zTPR, entonces el $d^\prime$ aumentará para un TPR más bajo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X