4 votos

Visualización de datos de respuesta binaria

Estoy buscando formas alternativas de representar mis datos.

He realizado un experimento, con dos variables manipuladas (v1 de 0 a 3, v2 de -3 a 0), y por diseño factorial arroja 4*4=16 estímulos. Los participantes dan una respuesta de 0/1 para cada estímulo. Así que para cada individuo tengo la siguiente matriz de respuestas (Tabla 1). Después de recoger los datos de varios individuos, puedo calcular el porcentaje de respuesta "1" para cada estímulo, lo que me lleva a un resumen de resultados para todos los individuos (Tabla 2).

Los participantes son reclutados en dos países. Por tanto, hay dos grupos de personas. Se enfrentan a los mismos estímulos. Mi objetivo final es comparar el patrón de respuesta diferente entre los dos grupos.

Table 1. Individual response matrix
+-----+---+----+----+----+
|v1/v2| 0 | -1 | -2 | -3 |
+-----+---+----+----+----+
| 0   | 0 | 0  | 1  | 0  |
+-----+---+----+----+----+
| 1   | 0 | 0  | 1  | 0  |
+-----+---+----+----+----+
| 2   | 0 | 0  | 1  | 1  |
+-----+---+----+----+----+
| 3   | 0 | 1  | 1  | 1  |
+-----+---+----+----+----+

Table 2. Summary results (percentage of "1" responses)
+-----+---+----+----+----+
|v1/v2| 0 | -1 | -2 | -3 |
+-----+---+----+----+----+
| 0   |20%| 39%| 45%| 50%|
+-----+---+----+----+----+
| 1   |34%| 53%| 78%| 78%|
+-----+---+----+----+----+
| 2   |43%| 85%| 95%| 99%|
+-----+---+----+----+----+
| 3   |80%| 86%|100%|100%|
+-----+---+----+----+----+

En mi historia, v1-v2 es siempre un predictor crucial. Para un grupo de participantes, el absoluto v2/v1 es también un predictor crucial. Para otro grupo, sólo importa v1-v2. El patrón idealizado es el siguiente:

enter image description here

Mis colegas consideran que estas cifras no son muy intuitivas. Así que estoy buscando formas alternativas de presentar los datos. He aquí algunas ideas que tengo, pero no estoy del todo seguro de cómo conseguirlo.

  1. Estoy pensando en una forma más "directa" de traducir la tabla resumen en gráficos, como colormap (no estoy seguro de que sea el nombre correcto). De esta manera podría utilizar v1 y v2 como dos ejes (en lugar de v1-v2), y marcar el valor a través del color. ¿Es esto implementable en R?

  2. Otra forma de revisar mi figura actual es que, sigo usando v1-v2 como eje x, pero no uso v2 como variable de agrupación, sino que muestro la varianza en cada nivel v1-v2, lo que también ayuda a distinguir los dos grupos.

  3. En el caso de las respuestas individuales (Tabla 1) parece haber una línea divisoria que separa el 0 y el 1 (la derecha tiene más probabilidades de ser 1, y la izquierda tiene más probabilidades de ser 0), y esta línea divisoria puede ser diferente para cada individuo. Los datos resumidos pierden esta información sobre los individuos. Me pregunto si podría estimar una línea límite para cada individuo (como una regresión), y comparar la distribución de esta línea límite entre dos grupos.

O si tienes otras ideas para presentar los datos, ¡te agradeceré tu ayuda!

0voto

Giulia Martini Puntos 169

Respecto a la pregunta 1, aquí un ejemplo con sus datos implementados en R:

library(tidyverse)

df = data.frame(v1 = c(rep(c(0,-1,-2,-3),4)), v2 = c(rep(0,4), rep(1,4), rep(2,4), rep(3,4)),
                percentage = c(20, 39, 45, 50, 34, 53, 78, 78, 43, 85, 95, 99, 80, 86, 100, 100) )

p = ggplot(df)
p = p + geom_raster(aes(x = v1, y = v2, fill = percentage))
p = p + scale_fill_gradient(low = "#56B1F7", high = "#132B43")
p = print(p)

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X