Hay cierta demanda de medidas del tamaño del efecto al hacer post hoc y estoy intentando decidir si incluirlo o no en un paquete R mío. Si lo hago, me concentraría en el Cohen's $d$ -medidas de estilo, que en el contexto de la comparación de la $i$ y $j$ en un experimento simple unidireccional se define como $$ d_{ij} = \frac{\mu_i - \mu_j}{\sigma} $$ Toma, $\mu_i$ et $\mu_j$ son las medias, y $\sigma$ es la desviación típica del error de los datos, que se supone común para todos los tratamientos. Puedo averiguar cómo estimar $d_{ij}$ a partir de los datos observados y construir un intervalo de confianza para él que tenga en cuenta la incertidumbre de las estimaciones de los tres parámetros.
Sin embargo, mis preguntas tienen que ver con la extensión de estas ideas a los experimentos con parcelas divididas. Hay algún debate al respecto aquí pero que se centra en las pruebas pre-post y no en un caso más general. Para concretar, me centraré en el experimento clásico de Yates sobre el rendimiento de la avena (datos disponibles como Oats
en el nlme en R). Este experimento tiene seis bloques (factor Block
); cada bloque se subdivide en 3 parcelas y se asigna aleatoriamente a los tres niveles del factor Variety
; y cada parcela se divide en cuatro subparcelas y se asigna aleatoriamente a los cuatro niveles del factor nitro
. Tengo preguntas sobre dos formas de analizar estos datos.
Modelo mixto homogéneo
Creo que ésta es la pregunta fácil... En este modelo, suponemos que el Block
los efectos son iid $N(0,\sigma_B^2)$ los efectos en toda la parcela (identificar Block:Variety
) son iid $N(0,\sigma_P^2)$ y los efectos residuales (subtrama) son iid $N(0,\sigma_E^2)$ . Un modelo aditivo con efectos fijos para Variety
et nitro
encaja bastante bien.
Lo que conjeturo es que podemos estimar la de Cohen $d$ valores para Variety
comparaciones o nitro
comparaciones como la comparación observada, dividida por una estimación de la DE total, $\sigma_T = \sqrt{\sigma_B^2 + \sigma_P^2 + \sigma_E^2}$ . ¿Es correcto? ¿O la gente utiliza algún otro $\sigma$ como referencia (aparte de modelar los bloques y/o las parcelas como efectos fijos)?
Modelo multivariado
Otra posibilidad es modelizar las cuatro observaciones de cada parcela (correspondientes a los 4 niveles de nitro
) como variable de respuesta multivariante. En ese caso, la Block
si se modelan como aleatorios, tienen una distribución multivariante, al igual que los errores. Los efectos de parcela se subsumen en estas distribuciones multivariantes. Podemos formar comparaciones significativas de medias marginales para Variety
et nitro
así como para sus combinaciones, ya que este modelo contiene implícitamente efectos de interacción.
Pero mi pregunta es, ¿cuál es un valor de referencia sensato, si es que lo hay? $\sigma$ para definir la $d$ -¿tamaño del efecto? Cada nivel de nitro
tiene su propia varianza de error. Puedo ver que para ciertas comparaciones de interacción (comparando Variety
avec nitro
mantenida fija en un nivel), esto está claro; pero no me queda nada claro qué define, si es que define algo, una $d$ para comparar los niveles de nitro
ya sea marginalmente o a un Variety
. ¿Alguien me lo puede aclarar?