6 votos

¿Como efectos del "truco" R en la producción de tratamiento en tratamiento * modelo simulado?

Estoy corriendo básicos de las regresiones que pueden ser especificados de forma compacta como la formula: y~treatment*dummy.

Dicen que hay varios ($m$) de los tratamientos, $T_1,\ldots,T_m$ ($T_1$ siendo la referencia/control); el maniquí también es multifacético (categórica), teniendo en $n$ valores $D_1,\ldots,D_n$

Entonces (la supresión de la observación índice y error) la fórmula anterior especificación básicamente devuelve la formula especificada como

$$y=T^TBD$$

Where $T$ is the $m\times el 1$ vector $[1, T_2, \ldots, T_m]$ of treatment indicators (excluding the reference treatment), $B$ is the $m\times n$ matrix of coefficients $\{\beta_{i,j}\}_{i=1,j=1}^{m\quad n}$, and $D$ is the $n\times del 1$ vector $[1, D_2,\ldots, D_n]$ of dummy indicators (excluding the reference category).

This is all well and good, but the resulting coefficients in $B$ don't really have any clean interpretation, especially for my application. In particular, I'm looking for significant treatment effects--consider trying to answer the following: was Treatment 5 significantly better among individuals in category 3?

In the above specification, we'd be examining $\mathbb{E}[y|T_5,D_3]-\mathbb{E}[y|T_1,D_3]=\beta_{5,0}+\beta_{5,3}$, so we could add the coefficients we get out and use, e.g., a Wald test to determine significance.

However, consider the equivalent specification (I'm 100% sure someone besides has written it this way before since it took me all of 20 minutes to come up with):

$$y = \delta_0 + \sum_{j=2}^n\beta_j D_j + \sum_{i=2}^m \sum_{j=1}^n \gamma_{i,j}T_iD_j$$

Now the treatment effect is $\mathbb{E}[y|T_5,D_3]-\mathbb{E}[y|T_1,D_3]=\gamma_{5,3}$.

Así que esta última formulación fácil de propiedad que podemos leer nuestros efectos del tratamiento de la derecha de nuestro regresión resumen (sobre todo incluyendo los errores estándar); su mayor inconveniente es que no hay manera de suministrar esta como un R formula parsimonia, o al menos yo no puedo ver un camino.

¿Alguien tiene alguna experiencia con algún secreto formula o el paquete para lidiar con esto (me imagino extremadamente comunes) especificación?

0voto

SkyBeam Puntos 541

Tengo que luchar un poco con la notación matemática, si puedo pero en la siguiente fórmula que proporciona:

$$y = \delta_0 + \sum_{j=1}^n\beta_j D_j + \sum_{i=1}^m \sum_{j=0}^n \gamma_{i,j}T_iD_j$$

No es que esencialmente diciendo que debe haber un coeficiente de cada variable ficticia (excepto la primera) y, a continuación, uno de los coeficientes por combinación de T y D? En ese caso, usted podría simplemente escribir la fórmula:

y ~ group + treatment:group

Pero cuando se incluyen los términos de interacción, a menudo se recomienda que usted debe incluir todos los términos principales que se incluyen en los términos de interacción:

y ~ group * treatment

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X