Quiero modelizar la productividad de un hayedo en relación con los índices de actividad fotosintética por satélite y las variables meteorológicas. Tengo datos de cinco años sobre el número de semillas recogidas en 30 parcelas de un metro cuadrado. Las parcelas están distribuidas en tres áreas de muestreo: 10 parcelas por localidad. Mis variables predictoras se repiten en las 10 parcelas de cada área de muestreo. Sé que se aconseja tener >5-6 niveles de efectos aleatorios por efecto aleatorio para construir un modelo mixto. Por lo tanto, en mi caso, ejecutar un modelo mixto no parece adecuado. Un enfoque alternativo puede ser promediar la pseudoreplicación dentro de cada área de muestreo y realizar mi análisis estadístico sobre las medias. Sin embargo, me temo que los valores promediados no sean independientes entre las zonas de muestreo porque la mayoría de las variables (dependientes e independientes) están sincronizadas (por ejemplo, la temperatura no varía mucho de un valle a otro)
¿Qué tipo de análisis debo realizar? ¿Es el tamaño de mi muestra demasiado pequeño para realizar un análisis estadístico?
¡Muchas gracias!
P.D.: a continuación encontrará la estructura de mi marco de datos
'data.frame': 150 obs. of 8 variables:
$ sampling_site: Factor w/ 3 levels "A","B","C": 1 1 1 1 1 1 1 1 1 1 ...
$ year : Factor w/ 5 levels "2013","2014",..: 1 1 1 1 1 1 1 1 1 1 ...
$ plot : Factor w/ 30 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
$ Ncounts : int 2 2 2 2 2 2 2 2 2 2 ...
$ Nseeds_sum : int 286 139 66 129 68 109 101 230 32 NA ...
$ temp : num 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 ...
$ prep : num 14.4 14.4 14.4 14.4 14.4 14.4 14.4 14.4 14.4 14.4 ...
$ evi : num 0.161 0.161 0.161 0.161 0.161 ...