4 votos

D de Cohen en experimentos con parcelas divididas

Hay cierta demanda de medidas del tamaño del efecto al hacer post hoc y estoy intentando decidir si incluirlo o no en un paquete R mío. Si lo hago, me concentraría en el Cohen's $d$ -medidas de estilo, que en el contexto de la comparación de la $i$ y $j$ en un experimento simple unidireccional se define como $$ d_{ij} = \frac{\mu_i - \mu_j}{\sigma} $$ Toma, $\mu_i$ et $\mu_j$ son las medias, y $\sigma$ es la desviación típica del error de los datos, que se supone común para todos los tratamientos. Puedo averiguar cómo estimar $d_{ij}$ a partir de los datos observados y construir un intervalo de confianza para él que tenga en cuenta la incertidumbre de las estimaciones de los tres parámetros.

Sin embargo, mis preguntas tienen que ver con la extensión de estas ideas a los experimentos con parcelas divididas. Hay algún debate al respecto aquí pero que se centra en las pruebas pre-post y no en un caso más general. Para concretar, me centraré en el experimento clásico de Yates sobre el rendimiento de la avena (datos disponibles como Oats en el nlme en R). Este experimento tiene seis bloques (factor Block ); cada bloque se subdivide en 3 parcelas y se asigna aleatoriamente a los tres niveles del factor Variety ; y cada parcela se divide en cuatro subparcelas y se asigna aleatoriamente a los cuatro niveles del factor nitro . Tengo preguntas sobre dos formas de analizar estos datos.

Modelo mixto homogéneo

Creo que ésta es la pregunta fácil... En este modelo, suponemos que el Block los efectos son iid $N(0,\sigma_B^2)$ los efectos en toda la parcela (identificar Block:Variety ) son iid $N(0,\sigma_P^2)$ y los efectos residuales (subtrama) son iid $N(0,\sigma_E^2)$ . Un modelo aditivo con efectos fijos para Variety et nitro encaja bastante bien.

Lo que conjeturo es que podemos estimar la de Cohen $d$ valores para Variety comparaciones o nitro comparaciones como la comparación observada, dividida por una estimación de la DE total, $\sigma_T = \sqrt{\sigma_B^2 + \sigma_P^2 + \sigma_E^2}$ . ¿Es correcto? ¿O la gente utiliza algún otro $\sigma$ como referencia (aparte de modelar los bloques y/o las parcelas como efectos fijos)?

Modelo multivariado

Otra posibilidad es modelizar las cuatro observaciones de cada parcela (correspondientes a los 4 niveles de nitro ) como variable de respuesta multivariante. En ese caso, la Block si se modelan como aleatorios, tienen una distribución multivariante, al igual que los errores. Los efectos de parcela se subsumen en estas distribuciones multivariantes. Podemos formar comparaciones significativas de medias marginales para Variety et nitro así como para sus combinaciones, ya que este modelo contiene implícitamente efectos de interacción.

Pero mi pregunta es, ¿cuál es un valor de referencia sensato, si es que lo hay? $\sigma$ para definir la $d$ -¿tamaño del efecto? Cada nivel de nitro tiene su propia varianza de error. Puedo ver que para ciertas comparaciones de interacción (comparando Variety avec nitro mantenida fija en un nivel), esto está claro; pero no me queda nada claro qué define, si es que define algo, una $d$ para comparar los niveles de nitro ya sea marginalmente o a un Variety . ¿Alguien me lo puede aclarar?

2voto

anand Puntos 199

Esto no es una respuesta completa de ninguna manera, pero encontré, de un hilo completamente separado, esta entrada del blog por Jake Westfall. Resumiré algunos de los puntos clave que allí se exponen (o al menos mi interpretación de los mismos).

  1. "Clásico" Cohen's $d$ se define en términos de $\sigma$ siendo la DE agrupada en un análisis unidireccional muy simple. W $\sigma$ en consecuencia.

  2. Más tarde, sugiere que el "clásico" de Cohen $d$ tiene mucho que recomendar, en la medida en que estos tamaños del efecto se utilizan a menudo para comparar efectos de diferentes estudios, y esto proporciona una base unificada para hacerlo.

  3. El debate de Westfall sobre $d_r$ (basado en la variación residual del modelo) viene a corroborar mi comentario sobre el uso del error total SD $\sigma_T$ en el modelo mixto homogéneo.

  4. Para el modelo multivariante, supongo basándome en (1) y (2) que se podría estimar $\sigma$ vía $\sqrt{\mbox{avg}(s^2)}$ (promedio de las varianzas de las respuestas multinomiales), ya que es comparable a la DE agrupada.

  5. Casi al final, se discuten las críticas a los tamaños del efecto estandarizados que han expresado varios autores (incluido Tukey). Pensaba que estaba de acuerdo con gran parte de lo que se decía, hasta que llego al final, donde dice que siguen siendo útiles para el análisis de potencia. Eso me desconcertó, porque en realidad he escrito sobre que es desaconsejable -- utilizar un tamaño del efecto estandarizado como valor objetivo para el cálculo del tamaño de la muestra proporciona el mismo $n$ independientemente de lo buena o mala que sea su instrumentación o su diseño.

Dicho esto, sigo considerando que esta cuestión no está resuelta. Sin embargo, a efectos de mi paquete R, estoy decidido a dejar la especificación de $\sigma$ de par en par y dejar que el usuario ( yo no ) tienen toda la responsabilidad posible a la hora de decidir qué especificar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X