2 votos

Cómo realizar la regresión con diferentes variantes de error

Tengo dos series de valores de medidas, la primera serie es X y la segunda es Y. Necesito modelar Y como una función de X, donde sé que el método que se utilizó para medir X es dos veces mejor que el método utilizado para medir Y en términos de varianza de error.

Me he informado sobre la regresión con término de error en la variable independiente, pero no estoy seguro de qué hacer cuando también hay término de error en la variable dependiente y son diferentes.

¿Qué técnica/herramientas/restricciones debo utilizar para este tipo de casos?

0voto

Iwasakabukiman Puntos 518

Bueno, en el mundo bayesiano, se podría hacer algo así (notación bugs/JAGS):

intcept ~ dnorm(0, 0.01)
sigma ~ dunif(0, 10)
X_SE ~ dunif(0, 10)
Y_SE <- X_SE * sqrt(2) # measurement error variance of X is supposed to be two times lower than of X

b ~ dnorm(0, 0.01)

for (i in 1:N) {
    X_real[i] ~ dnorm(X[i], 1/X_SE^2)
    Y_real_exp[i] <- intcept + b * X_real[i]
    Y_real[i] ~ dnorm(Y_real_exp[i], 1/sigma^2)
    Y[i] ~ dnorm(Y_real[i], 1/Y_SE^2)
}

X[i] e Y[i] son tus medidas; X_real e Y_real son los valores reales, que no conoces. X_SE e Y_SE son sus errores de medición de X e Y. Esto es realmente hermoso en los modelos bayesianos, que usted puede modelar esto muy fácilmente. Y la regresión en sí se hace sobre esos valores latentes (desconocidos) de X_real e Y_real. Se aconseja estandarizar X.

No estoy seguro de cómo hacer esto en un entorno no bayesiano. Los procesos gaussianos también deberían ser capaces de manejar datos de entrada inciertos, pero no tengo experiencia en ello.

EDIT: Me di cuenta de que este modelo tendría un problema para identificar los parámetros X_SE e Y_SE. Sólo se puede aplicar si usted tiene alguna estimación de lo grande que estos errores son, ya que el modelo no tiene información de cómo decir lo grande que estos errores son en realidad.

0voto

kjetil b halvorsen Puntos 7012

Así que sabes que $X$ se mide con la mitad de la varianza de error como $Y$ . Entonces debería utilizar regresión ponderada y se sabe que los pesos óptimos (para los mínimos cuadrados) son proporcionales a la varianza inversa.

Con un software útil la función de regresión tiene un argumento para los pesos. Yo R con lm ese es el argumento weights= . Con sus dos respuestas en vectores x y y esto puede ser:

n <- length(x);   m <- length(y)    
Z <- c(x,y)
mod.wlm <- lm(Z ~ <your predictors>, weights=c(rep(0.5,n), rep(1,m)), ... )

Cualquier buen libro sobre regresión lineal tendría un capítulo sobre regresión ponderada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X