10 votos

Debe la diferencia entre el control y el tratamiento se modela explícitamente o implícitamente?

Dado el siguiente diseño experimental:

Múltiples muestras son tomadas de un sujeto y de cada muestra es tratada de varias maneras (como un tratamiento de control). ¿Cuál es principalmente interesante es la diferencia entre el grupo control y de cada tratamiento.

Puedo pensar en dos modelos simples para este tipo de datos. Con la muestra $i$ tratamiento $j$, el tratamiento, siendo 0 el control, vamos a $Y_{ij}$ ser los datos, $\gamma_i$ ser la base para la muestra $i$, $\delta_j$ ser la diferencia para el tratamiento de la $j$. El primer modelo se ve tanto en el control y la diferencia:

$$ Y_{ij}=\gamma_i+\delta_j+\epsilon_{ij} $$ $$ \delta_0=0 $$

Mientras que el segundo modelo sólo se ve la diferencia. Si queremos calcular previamente $d_{ij}$ antemano $$ d_{ij}=Y_{ij}-Y_{i0} $$ entonces $$ d_{ij}=\delta_j+\varepsilon_{ij} $$

Mi pregunta es ¿cuáles son las diferencias fundamentales entre estas dos configuraciones? En particular, si los niveles no tienen sentido en sí mismos y sólo la diferencia que importa, es el primer modelo haciendo demasiado y tal vez de poca potencia?

6voto

jldugger Puntos 7490

El $\epsilon_{ij}$ son probablemente correlacionados en el segundo modelo, pero no la primera.

En la primera, estos términos representan los errores de medición y desviaciones del modelo aditivo. Con un cuidado razonable-como por la aleatoriedad de la secuencia de mediciones--los errores pueden ser independientes cuando el modelo es exacta. De dónde

$$d_{ij} = Y_{ij} - Y_{i0} = \gamma_i + \delta_j + \epsilon_{ij} - (\gamma_i + \delta_0 + \epsilon_{i0}) = \delta_j + (\epsilon_{ij} - \epsilon_{i0}).$$

(Tenga en cuenta que esto contradice la última ecuación en la pregunta, porque es erróneo suponer $\epsilon_{i0}=0$. Hacerlo nos obligaría a admitir que el $\gamma_i$ son variables aleatorias en lugar de los parámetros de, al menos, una vez que reconocemos la posibilidad de que el error de medición para el control. Esto llevaría a las mismas conclusiones a continuación).

Para $j, k \ne 0$, $j \ne k$ esto implica

$$Cov(d_{ij}, d_{ik}) = Cov(\epsilon_{ij} - \epsilon_{i0}, \epsilon_{ik} - \epsilon_{i0}) = Var(\epsilon_{i0}) \ne 0.$$

La correlación puede ser sustancial. Para iid errores, similar al cálculo de la muestra es igual a 0.5. A menos que usted está utilizando procedimientos que de manera explícita y manejar correctamente esta correlación, a favor de la primera modelo sobre el segundo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X