Tengo una variable dependiente ordinal, la facilidad, que va de 1 (nada fácil) a 5 (muy fácil). El aumento de los valores de los factores independientes se asocia a un aumento de la facilidad.
Dos de mis variables independientes ( condA
y condB
) son categóricos, cada uno con 2 niveles, y 2 ( abilityA
, abilityB
) son continuas.
Estoy utilizando el ordinal en R, donde utiliza lo que creo que es
$$\text{logit}(p(Y \leqslant g)) = \ln \frac{p(Y \leqslant g)}{p(Y > g)} = \beta_{0_g} - (\beta_{1} X_{1} + \dots + \beta_{p} X_{p}) \quad(g = 1, \ldots, k-1)$$
(de la respuesta de @caracal aquí )
He estado aprendiendo esto de forma independiente y agradecería cualquier ayuda posible ya que todavía estoy luchando con ella. Además de los tutoriales que acompañan al paquete ordinal, también he encontrado lo siguiente para ser útil:
- Interpretación de la regresión logística ordinal
- Coeficiente negativo en la regresión logística ordenada
Pero estoy intentando interpretar los resultados y reunir los distintos recursos y me estoy atascando.
-
He leído muchas explicaciones diferentes, tanto abstractas como aplicadas, pero todavía me cuesta hacerme a la idea de lo que significa:
Con un aumento de 1 unidad en condB (es decir, cambiando de un nivel al siguiente del predictor categórico), las probabilidades predichas de observar Y = 5 frente a Y = 1 a 4 (así como las probabilidades predichas de observar Y = 4 frente a Y = 1 a 3) cambian en un factor de exp(beta) que, para el diagrama, es exp(0,457) = 1,58.
a. ¿Es diferente para las variables independientes categóricas que para las continuas?
b. Parte de mi dificultad puede estar en la idea de las probabilidades acumulativas y esas comparaciones. ... ¿Es justo decir que pasar de condA = ausente (nivel de referencia) a condA = presente tiene 1,58 veces más probabilidades de ser calificado en un nivel más alto de facilidad? Estoy bastante seguro de que eso NO es correcto, pero no estoy seguro de cómo expresarlo correctamente.
Gráficamente,
1. Implementación del código en esta entrada No entiendo por qué los valores de "probabilidad" resultantes son tan elevados.
2. La gráfica de p (Y = g) en esta entrada tiene más sentido para mí ... con una interpretación de la probabilidad de observar una categoría particular de Y en un valor particular de X. La razón por la que estoy tratando de obtener el gráfico en el primer lugar es para obtener una mejor comprensión de los resultados en general.
Este es el resultado de mi modelo:
m1c2 <- clmm (easiness ~ condA + condB + abilityA + abilityB + (1|content) + (1|ID),
data = d, na.action = na.omit)
summary(m1c2)
Cumulative Link Mixed Model fitted with the Laplace approximation
formula:
easiness ~ illus2 + dx2 + abilEM_obli + valueEM_obli + (1 | content) + (1 | ID)
data: d
link threshold nobs logLik AIC niter max.grad
logit flexible 366 -468.44 956.88 729(3615) 4.36e-04
cond.H
4.5e+01
Random effects:
Groups Name Variance Std.Dev.
ID (Intercept) 2.90 1.70
content (Intercept) 0.24 0.49
Number of groups: ID 92, content 4
Coefficients:
Estimate Std. Error z value Pr(>|z|)
condA 0.681 0.213 3.20 0.0014 **
condB 0.457 0.211 2.17 0.0303 *
abilityA 1.148 0.255 4.51 6.5e-06 ***
abilityB 0.577 0.247 2.34 0.0195 *
Threshold coefficients:
Estimate Std. Error z value
1|2 -3.500 0.438 -7.99
2|3 -1.545 0.378 -4.08
3|4 0.193 0.366 0.53
4|5 2.121 0.385 5.50