De manera que el fondo es que la he recogido los datos de rendimiento para los últimos 5-6 décadas y la ubicación de donde he recopilado los datos de rendimiento había variedades de alto rendimiento introducidas a lo largo del tiempo. Estoy buscando en la relación entre el rendimiento y la lluvia, pero esta introducción de HYV podría afectar el verdadero impacto de monzón en el rendimiento y por lo tanto estoy detrending los datos para eliminar el efecto de HYV.
Hice una regresión lineal de rendimiento contra el tiempo en R:
mdl1 <- lm(yield ~ time, data=data)
y luego se quita la tendencia lineal tomando los residuos de la regresión anterior:
yield.res <- resid(mdl1)
Ahora estoy usando estos residuos para mi posterior análisis. Por ejemplo, la relación entre el rendimiento y la lluvia es:
mdl2 <- lm(yield.res ~ rain, data=data)
En este caso, hacer mi yield.res
tiene que ser distribuido normalmente antes de hacer esta regresión? Si sí, ¿qué tipo de transformación necesito? Desde yield.res
consiste en positivos y negativos de los números, estoy un poco confundido de cómo ir sobre ella.