Processing math: 100%

1 votos

Necesito ayuda con la especificación de un modelo de efectos aleatorios / mixtos anidados

Soy un principiante en metaanálisis y necesito tu opinión sobre el diseño de mi modelo de efectos aleatorios.

He realizado un experimento sobre el rendimiento de un proveedor que tiene alrededor de 30-40 centros de datos. Elegí dos de estos centros de datos al azar y monitoreé su rendimiento durante 7 días consecutivos de la semana. Tomé 2 mediciones por día (1 durante horas pico y 1 durante horas valle). Ahora tengo tres factores en el diseño de mi experimento: centros de datos, día y hora con 2, 7 y 2 niveles respectivamente. Quiero saber cuánto contribuye cada uno de estos factores a la varianza en el rendimiento. Tengo en mente el siguiente modelo anidado:

m1 <- lme(Rendimiento ~ 1, random =~ 1|CentroDatos/Día/Hora, data=misdatos)

Estoy bastante seguro de que el factor tiempo está anidado dentro del día; sin embargo, no estoy del todo seguro de si el centro de datos debería ser parte de la estructura anidada. Supongo que cada centro de datos puede tener su propio patrón de variabilidad en diferentes días, por eso lo incluí en la estructura anidada.

¿Crees que este modelo es correcto? ¿Hay algún otro enfoque que puedas sugerir?

Gracias.

1voto

unk2 Puntos 36

No utilice un modelo mixto. Los niveles de un factor aleatorio deberían ser intercambiables, esto solo es el caso para datacenter. Day es problemático ya que podría haber efectos de inicio/fin de semana. ¿Incluso no queda claro si el fin de semana está incluido? Mirando el tiempo, pico y fuera de pico obviamente no son intercambiables.

También debería tener más de dos niveles para un factor aleatorio. Dos no son suficientes, por lo que ni siquiera datacenter debería ser un factor aleatorio. De lo contrario, datacenter sería un candidato muy bueno para ser modelado como un factor aleatorio.

Dudo en sugerir cualquier análisis alternativo ya que al considerar los tres factores experimentales y sus interacciones, solo tiene una muestra por grupo. ¿Hay alguna razón válida para presuponer que el rendimiento no depende de la combinación exacta de datacenter, pico/fuera de pico y día de la semana?

0voto

rnso Puntos 2424

Si probaste solo 2 centros y solo una vez en hora pico y hora no pico en cada día, el tamaño de la muestra es demasiado pequeño para el análisis del día de la semana.

Creo que puedes usar aquí regresión lineal con interacciones de otras variables:

lm(rendimiento ~ DC * Tiempo, data=misdatos) 

Editar: El ejemplo del precio naranja en los documentos sobre el uso de lsmeans es muy similar a tus datos y puede resultarte útil: http://cran.r-project.org/web/packages/lsmeans/vignettes/using-lsmeans.pdf

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X