8 votos

Parcela dividida en R

Tengo un conjunto de datos de $n$ puntos de referencia y $m$ submuestras en cada punto de referencia. Ejecuto estos puntos de referencia y sus submuestras en $p$ máquinas sujetas. El "individuo" estudiado por las submuestras es el mismo para cada máquina temática, y los puntos de referencia son los mismos para cada máquina temática.

¿Cómo puedo realizar un ANOVA en R en esta situación?

Principalmente quiero calcular la media total y los intervalos de confianza. No me importan en absoluto las medias de las submuestras, pero quiero reconocer la réplica en la confianza y las medias finales. Sin embargo, es posible que me interesen las medias de referencia. No puedo averiguar cómo configurar este anova en R. Quiero ser capaz de replicar las medias mediante el cálculo manual.

He intentado glm , anova , aov y lme pero estoy totalmente confundido. Creo que los resultados del ANOVA deberían ser equivalentes para dos máquinas sujetas a la media anidada de máquina/parámetro/punto de control, pero las medias no salen igual cuando las pruebo.

Editar:

Estoy empezando a tener una pista de http://zoonek2.free.fr/UNIX/48_R/13.html

6voto

merriam Puntos 67

La principal diferencia entre el diseño de parcelas divididas y otros diseños, como el diseño completamente aleatorio y las variaciones de los diseños de bloques, es la estructura de anidamiento de los sujetos, es decir, cuando las observaciones se obtienen del mismo sujeto (unidad experimental) más de una vez. Esto conduce a una estructura de correlación dentro de un sujeto en el diseño de parcela dividida que es diferente de la estructura de correlación en un bloque.

Tomemos una imagen de ejemplo de un conjunto de datos de un diseño simple de parcela dividida (abajo). Se trata de un estudio sobre la composición de la dieta en la salud; se asignaron aleatoriamente cuatro dietas a 12 sujetos, todos con un estado de salud similar. Se estableció la presión arterial de referencia, y una medida de la salud fue el cambio de la presión arterial después de dos semanas. La presión arterial se midió por la mañana y por la noche. (El ejemplo está copiado de Libro de diseño estadístico de Casella ejemplo 5.1)

$$ \begin{array}{r|ccccc|l} ~ & \text{Diet} 1 & \text{Diet} 2 & \text{Diet}3 & \text{Diet}4 \\\hline ~ & \text{Subject} & \text{Subject} & \text{Subject} &\text{Subject}\\ ~ & 1 \, 2 \, 3 & 4 \, 5 \, 6 & 7 \, 8 \, 9 & 10 \, 11 \, 12\\\hline \text{Morning} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \text{Evening} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \hline \end{array} $$

Hay que tener en cuenta algunas cosas importantes:

  • Hay 12 unidades experimentales (12 sujetos)
  • En estas 12 unidades observamos 24 puntos de datos ( $2 \times 4 \times 3$ ), denotado por $x$
  • Esto es así porque tomamos dos observaciones sobre el mismo tema, la primera por la mañana y la segunda por la tarde
  • Esto significa que las dos observaciones de un sujeto proceden de la misma unidad experimental. Por lo tanto, no se trata de una verdadera replicación. Dado que las observaciones se toman del mismo sujeto en el transcurso del tiempo, debe haber alguna correlación entre las dos observaciones.
  • Tenga en cuenta que esto es diferente de un ANOVA de dos vías con Dieta y Tiempo como los factores.
  • Un ANOVA de dos vías tendrá observaciones como ésta:

$$ \begin{array}{r|ccccc|l} ~ & \text{Diet} 1 & \text{Diet} 2 & \text{Diet}3 & \text{Diet}4 \\\hline \text{Morning} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \text{Evening} & x \, x \, x & x \, x \, x & x \, x \, x & x \, x \, x\\ \hline \end{array} $$

cada uno de los $x$ s aquí donde hay diferentes temas. Esto ilustra el concepto de anidación. Es decir, los sujetos 1, 2, 3 están anidados en la Dieta 1. - Las parcelas completas, las unidades experimentales a nivel de parcela completa (Dieta) (los Sujetos) actúan como bloques para el tratamiento de parcela dividida (Mañana- Tarde)

El modelo para este diseño de parcela dividida es:

$$ Y_{ijk} = \mu + \tau_i + S_{ij} + \gamma_{k} + (\tau \gamma)_{ik} + \epsilon_{ijk}, $$ donde $$ Y_{ijk} = \text{the response to diet i of subject j at time k,} $$ $$ \tau_i = \text{diet i effect} $$ $$ S_{ij} = \text{subject j's effect in diet i (whole plot error)} $$ $$ (\tau \gamma)_{ik} = \text{the interaction of diet i and time j} $$ $$ \epsilon_{ijk} = \text{split plot error} $$ Una vez que tenga el modelo bien formulado, escriba en R aov forma es trivial:

splitPltMdl <- aov(bloodPressure ~ Diet + ## Diet effect 
                                   Error(Subject/Diet) + ## nesting of Subject in Diet 
                                   Time*Diet, ## interaction of Time and Diet 
                                   data = dietData)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X