1 votos

cómo modelar datos con medidas repetidas pero con un bajo número de niveles de efectos aleatorios

Quiero modelizar la productividad de un hayedo en relación con los índices de actividad fotosintética por satélite y las variables meteorológicas. Tengo datos de cinco años sobre el número de semillas recogidas en 30 parcelas de un metro cuadrado. Las parcelas están distribuidas en tres áreas de muestreo: 10 parcelas por localidad. Mis variables predictoras se repiten en las 10 parcelas de cada área de muestreo. Sé que se aconseja tener >5-6 niveles de efectos aleatorios por efecto aleatorio para construir un modelo mixto. Por lo tanto, en mi caso, ejecutar un modelo mixto no parece adecuado. Un enfoque alternativo puede ser promediar la pseudoreplicación dentro de cada área de muestreo y realizar mi análisis estadístico sobre las medias. Sin embargo, me temo que los valores promediados no sean independientes entre las zonas de muestreo porque la mayoría de las variables (dependientes e independientes) están sincronizadas (por ejemplo, la temperatura no varía mucho de un valle a otro)

¿Qué tipo de análisis debo realizar? ¿Es el tamaño de mi muestra demasiado pequeño para realizar un análisis estadístico?

¡Muchas gracias!

P.D.: a continuación encontrará la estructura de mi marco de datos

'data.frame':   150 obs. of  8 variables:
 $ sampling_site: Factor w/ 3 levels "A","B","C": 1 1 1 1 1 1 1 1 1 1 ...
 $ year         : Factor w/ 5 levels "2013","2014",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ plot         : Factor w/ 30 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
 $ Ncounts      : int  2 2 2 2 2 2 2 2 2 2 ...
 $ Nseeds_sum   : int  286 139 66 129 68 109 101 230 32 NA ...
 $ temp         : num  4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 ...
 $ prep         : num  14.4 14.4 14.4 14.4 14.4 14.4 14.4 14.4 14.4 14.4 ...
 $ evi          : num  0.161 0.161 0.161 0.161 0.161 ...

1voto

Maran Puntos 2283

Gracias por publicar tus datos, Carlos. Por favor, ten en cuenta que no soy ecologista, así que no puedo hablar de si lo que propongo tiene sentido en tu campo. Sin embargo, dados tus datos, te sugeriría que consideraras un modelo de dos niveles (efectos mixtos), con las 5 observaciones anuales anidadas en 30 parcelas. Trataría el lugar de muestreo como un factor fijo con tres niveles porque, como sospecha, no hay suficientes niveles para tratarlo como un factor aleatorio, a menos que se sienta cómodo con un enfoque bayesiano. En lmer :

m1 <- lmer(outcome ~ 1 + predictors + sampling_site + (1|plot), data=df)

Un elemento que debe considerar cuidadosamente es cómo tratar el año. ¿Espera que haya algún tipo de tendencia sistemática, lineal o de otro tipo, en su resultado en función del tiempo (año)? ¿Y ese efecto variaría en sus parcelas? Si la respuesta es afirmativa, podría considerar un modelo de curva de crecimiento:

m2 <- lmer(outcome ~ 1 + predictors + year + sampling_site + (year|plot), data=df)

Esto permite un efecto lineal medio del año (el predictor fijo) y luego permite la variación de esta tendencia lineal para cada parcela (la pendiente aleatoria para el año). Si esto no parece razonable, entonces puede tener en cuenta el año como un conjunto de predictores fijos que tienen el efecto de estimar las asociaciones entre los predictores y el resultado dentro de los años:

m3 <- lmer(outcome ~ 1 + predictors + as.factor(year) + sampling_site + (1|plot), data=df)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X