Cambié completamente mi respuesta a raíz de una larga conversación con Daniel. Intentaré proporcionar algunos antecedentes para que los lectores interesados puedan entender mi respuesta.
Según entiendo la pregunta, Daniel intenta evaluar el efecto de no.Verde en la probabilidad de que los sujetos elijan el rojo en un experimento. no.Verde es el número de bolas (1, 2, 3 o 4). Y el experimento se llevó a cabo bajo varias condiciones, a saber: bajo no.Rojo igual a 5, 7 y 9; y bajo condición en la que el mensaje es azul y el mensaje es rojo. Por lo tanto, tenemos un total de 4 * 3 * 2 = 24 condiciones (4 condiciones de no.Verde, 3 condiciones de no.Rojo y 2 condiciones de mensaje azul o rojo).
Una única regresión con todos los términos de interacción es bastante compleja de interpretar. Sin embargo, su tarea principal es bastante sencilla, a saber: demostrar que no.verde tiene un efecto sobre la probabilidad de elegir el rojo. Por tanto, mi sugerencia es realizar una regresión separada para las condiciones mensaje == azul y mensaje == rojo, y también una regresión separada para cada condición no.rojo. Además, simplificaré las cosas suponiendo que no.Green es continua (parece que es posible tratarla como continua, o al menos como una variable de intervalo). En R, para el caso mensaje == azul, basta con hacer esto:
fit.1 = glm(DecisionasReceiver ~ no.GREEN, family=binomial, data=subset(lue, messagereceived=="blue" & no.RED==5) )
fit.2 = glm(DecisionasReceiver ~ no.GREEN, family=binomial, data=subset(lue, messagereceived=="blue" & no.RED==7) )
fit.3 = glm(DecisionasReceiver ~ no.GREEN, family=binomial, data=subset(lue, messagereceived=="blue" & no.RED==9) )
Ahora, para evaluar correctamente el efecto de no.green, hay que tener en cuenta la incertidumbre de las estimaciones. Si nos fijamos en los errores estándar, veremos que no.green es significativo. Sin embargo, fijarse sólo en los errores estándar no permite comprender adecuadamente el rango de incertidumbre. Digamos, por ejemplo, que está interesado en saber cómo de menos propensos a elegir el rojo son los sujetos (bajo la condición nº rojo ==5) con nº verde == 2 en comparación con los sujetos con nº verde == 1. Para responder a este tipo de pregunta, se puede utilizar el método de los errores estándar. Para responder a este tipo de pregunta, es mejor, creo yo, fijarse en la probabilidad predicha, pero teniendo en cuenta la incertidumbre en las estimaciones. Para ello, voy a utilizar la función "sim", del paquete arm.
require(arm)
n.sims = 1000
sim.1 = sim(fit.1, n.sims)
with(subset(lue, messagereceived=="blue" & no.RED==5), plot(no.GREEN,jitter(DecisionasReceiver, .1),
ylab="Probability of Choosing Red", xlab="Number of Green",
main="Effect of Green under no.Red equals 5"))
for (s in 1:100)
curve(invlogit(coef(sim.1)[s,1] +coef(sim.1)[s,2]*x), col="gray", xlim=c(1,4), add=T)
El resultado es un gráfico con 100 curvas logísticas. Cada curva representa un posible efecto del nº verde sobre la probabilidad de elegir el rojo. A partir del gráfico, vemos cuál es el rango más probable de probabilidad predicha para cada valor de no.verde.
Espero que te ayude.