La principal diferencia entre el diseño de parcelas divididas y otros diseños, como el diseño completamente aleatorio y las variaciones de los diseños de bloques, es la estructura de anidamiento de los sujetos, es decir, cuando las observaciones se obtienen del mismo sujeto (unidad experimental) más de una vez. Esto conduce a una estructura de correlación dentro de un sujeto en el diseño de parcela dividida que es diferente de la estructura de correlación en un bloque.
Tomemos una imagen de ejemplo de un conjunto de datos de un diseño simple de parcela dividida (abajo). Se trata de un estudio sobre la composición de la dieta en la salud; se asignaron aleatoriamente cuatro dietas a 12 sujetos, todos con un estado de salud similar. Se estableció la presión arterial de referencia, y una medida de la salud fue el cambio de la presión arterial después de dos semanas. La presión arterial se midió por la mañana y por la noche. (El ejemplo está copiado de Libro de diseño estadístico de Casella ejemplo 5.1)
$$ \begin{array}{r|ccccc|l} ~ & \text{Diet} 1 & \text{Diet} 2 & \text{Diet}3 & \text{Diet}4 \\\hline ~ & \text{Subject} & \text{Subject} & \text{Subject} &\text{Subject}\\ ~ & 1 \, 2 \, 3 & 4 \, 5 \, 6 & 7 \, 8 \, 9 & 10 \, 11 \, 12\\\hline \text{Morning} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \text{Evening} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \hline \end{array} $$
Hay que tener en cuenta algunas cosas importantes:
- Hay 12 unidades experimentales (12 sujetos)
- En estas 12 unidades observamos 24 puntos de datos ( $2 \times 4 \times 3$ ), denotado por $x$
- Esto es así porque tomamos dos observaciones sobre el mismo tema, la primera por la mañana y la segunda por la tarde
- Esto significa que las dos observaciones de un sujeto proceden de la misma unidad experimental. Por lo tanto, no se trata de una verdadera replicación. Dado que las observaciones se toman del mismo sujeto en el transcurso del tiempo, debe haber alguna correlación entre las dos observaciones.
- Tenga en cuenta que esto es diferente de un ANOVA de dos vías con Dieta y Tiempo como los factores.
- Un ANOVA de dos vías tendrá observaciones como ésta:
$$ \begin{array}{r|ccccc|l} ~ & \text{Diet} 1 & \text{Diet} 2 & \text{Diet}3 & \text{Diet}4 \\\hline \text{Morning} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \text{Evening} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \hline \end{array} $$
cada uno de los $x$ s aquí donde hay diferentes temas. Esto ilustra el concepto de anidación. Es decir, los sujetos 1, 2, 3 están anidados en la Dieta 1. - Las parcelas completas, las unidades experimentales a nivel de parcela completa (Dieta) (los Sujetos) actúan como bloques para el tratamiento de parcela dividida (Mañana- Tarde)
El modelo para este diseño de parcela dividida es:
$$ Y_{ijk} = \mu + \tau_i + S_{ij} + \gamma_{k} + (\tau \gamma)_{ik} + \epsilon_{ijk}, $$ donde $$ Y_{ijk} = \text{the response to diet i of subject j at time k,} $$ $$ \tau_i = \text{diet i effect} $$ $$ S_{ij} = \text{subject j's effect in diet i (whole plot error)} $$ $$ (\tau \gamma)_{ik} = \text{the interaction of diet i and time j} $$ $$ \epsilon_{ijk} = \text{split plot error} $$ Una vez que tenga el modelo bien formulado, escriba en R
aov
forma es trivial:
splitPltMdl <- aov(bloodPressure ~ Diet + ## Diet effect
Error(Subject/Diet) + ## nesting of Subject in Diet
Time*Diet, ## interaction of Time and Diet
data = dietData)