Yo expresaría este modelo como
Pr
donde \Lambda(x) es la función logit inversa \frac{\exp(x)}{1 + \exp(x)} .
Los dos efectos del tratamiento son:
TE_i(t_i=1) = \Lambda \left[ \beta_0 + \beta_1 + \gamma_{k} \right]-\Lambda \left[ \beta_0 + \gamma_{k} \right] y TE_i(t_i=2)= \Lambda \left[ \beta_0 + \beta_2 + \gamma_{k} \right]-\Lambda \left[ \beta_0 + \gamma_{k} \right]
Esto le da el cambio esperado en la probabilidad de acertar la pregunta para cada tratamiento, medido en relación con el resultado de control para un estudiante en la escuela k . También se puede obtener el efecto contrastando los dos tratamientos de la misma manera. Se denominan diferencias finitas, para distinguirlas de un efecto basado en la derivada que podría utilizar para un tratamiento continuo.
La gente suele calcular la media de estos en la muestra para llegar a dos números únicos. Esto puede ser un resumen útil, especialmente si las escuelas no importan mucho.
Los coeficientes de las funciones de índice logit son más difíciles de interpretar, ya que no están en la escala de probabilidad. Sí tienen una interpretación en la escala de logaritmos, pero, según mi experiencia, es mejor evitarla a menos que te comuniques con jugadores o que esa sea la norma en tu disciplina académica.
Para medir el efecto de estar en cualquier grupo, se puede utilizar un modelo en el que se agrupan los dos tratamientos en uno para estimar \Pr(y_i=1 \vert t,s_i=k) = \Lambda \left[ \alpha_0 + \alpha \mathbb{I}(t_i =1 \textrm{ or }2) + \delta_{k} \right],
y proceder como en el caso anterior. A \beta s por la proporción de tratados en cada grupo de tratamiento cuando se calcula la diferencia finita:
TE_i = \Lambda \left[ \beta_0 + \beta_1 \frac{n_1}{n_1 + n_2} + \beta_1 \frac{n_2}{n_1 + n_2} + \gamma_{k} \right]- \Lambda \left[ \beta_0 + \gamma_{k} \right].
Este es un contrafactual un poco extraño.