Dado que el error estándar de una regresión lineal se suele dar para la variable de respuesta, me pregunto cómo obtener intervalos de confianza en la otra dirección, por ejemplo, para una intersección x. Soy capaz de visualizar lo que podría ser, pero estoy seguro de que debe haber una forma sencilla de hacerlo. Soy capaz de visualizar lo que podría ser, pero estoy seguro de que debe haber una manera directa de hacer esto. A continuación se muestra un ejemplo en R de cómo visualizar esto:
set.seed(1)
x <- 1:10
a <- 20
b <- -2
y <- a + b*x + rnorm(length(x), mean=0, sd=1)
fit <- lm(y ~ x)
XINT <- -coef(fit)[1]/coef(fit)[2]
plot(y ~ x, xlim=c(0, XINT*1.1), ylim=c(-2,max(y)))
abline(h=0, lty=2, col=8); abline(fit, col=2)
points(XINT, 0, col=4, pch=4)
newdat <- data.frame(x=seq(-2,12,len=1000))
# CI
pred <- predict(fit, newdata=newdat, se.fit = TRUE)
newdat$yplus <-pred$fit + 1.96*pred$se.fit
newdat$yminus <-pred$fit - 1.96*pred$se.fit
lines(yplus ~ x, newdat, col=2, lty=2)
lines(yminus ~ x, newdat, col=2, lty=2)
# approximate CI of XINT
lwr <- newdat$x[which.min((newdat$yminus-0)^2)]
upr <- newdat$x[which.min((newdat$yplus-0)^2)]
abline(v=c(lwr, upr), lty=3, col=4)
1 votos
Podrías arrancar esto:
library(boot); sims <- boot(data.frame(x, y), function(d, i) { fit <- lm(y ~ x, data = d[i,]) -coef(fit)[1]/coef(fit)[2] }, R = 1e4); points(quantile(sims$t, c(0.025, 0.975)), c(0, 0))
. Para los intervalos de predicción inversa, véase el archivo de ayuda dechemCal:::inverse.predict
da la siguiente referencia que también podría ayudar a derivar un IC: Massart, L.M, Vandenginste, B.G.M., Buydens, L.M.C., De Jong, S., Lewi, P.J., Smeyers-Verbeke, J. (1997) Handbook of Chemometrics and Qualimetrics: Parte A, p. 2000 votos
@Roland - Gracias por esto. Muy útil. ¿Alguna idea de por qué la rutina bootstrap produce intervalos notablemente más estrechos que el método que muestro?
1 votos
Lo que muestra en el gráfico no es el IC para el intercepto. Muestras los puntos donde las líneas de confianza inferior y superior de las predicciones cruzan el eje.
0 votos
No estoy seguro de entender el problema, ya que estos parecen ser los intersticios X previstos en los extremos de los SE de los coeficientes.
0 votos
Los puntos donde sus líneas azules cruzan el eje son los límites de confianza inferior/superior (resp.) correspondientes a los puntos donde sus líneas azules cruzan la línea de predicción. No están directamente relacionados con el intervalo de confianza de la intercepción x.
1 votos
A menudo, en regresión lineal se tiene un modelo que dice algo así: Yi=α+βxi+εiwhere ε1,…εn∼i.i.d. N(0,σ2), para que el Y s se tratan como aleatorios y los x s como fijos. Eso puede justificarse diciendo que buscas una distribución condicional dada la x s. En la práctica, si se toma una nueva muestra, no suele ser sólo la Y s sino también el x s que cambian, lo que sugiere que en algunas circunstancias también deberían considerarse aleatorios. Me pregunto si esto influye en la conveniencia de …
0 votos
… encontrar un intervalo de confianza para el x -¿Interceptar?
1 votos
stats.stackexchange.com/search?q="inverse+regression "
0 votos
¿Hay alguna posibilidad de que pueda validar mi respuesta? Gracias.
1 votos
@AdrienRenaud - Me parece que tu respuesta es demasiado simplista dados los aspectos asimétricos que he mencionado, y que se ponen de manifiesto en el ejercicio de bootstrapping que ha ilustrado Roland. Si no estoy pidiendo demasiado, tal vez podrías ampliar el enfoque de probabilidad que has mencionado.
0 votos
No mencionaste el aspecto asimétrico en tu pregunta y no era obvio en la figura. Así que no me parece justo ;) Si su procedimiento de ajuste devuelve un intervalo de confianza (ci) simétrico sobre los parámetros, entonces el ci sobre el intercepto será simétrico.
0 votos
@AdrienRenaud - Si no he elaborado la pregunta completamente, lo siento - sólo quiero asegurarme de que tenemos una buena respuesta canónica aquí. Tanto mi enfoque (simplista) como el enfoque bootstrapping indican un intervalo asimétrico, y esto parece probable dados los supuestos de una regresión lineal. Voy a subir la apuesta con una recompensa si eso motiva :-)
0 votos
He comprobado su procedimiento utilizando la construcción de Neyman y un enfoque teórico. Seguimos teniendo una cobertura insuficiente, pero aumentar el número de puntos de datos podría resolver ese problema. ¿Quiere probar con mi script? Mi enfoque teórico combinado con las propiedades OLS podría indicar que su resultado es óptimo. Si tenemos cobertura y optimalidad, podríamos tener una gran respuesta a esta pregunta.
0 votos
He comprobado que tenemos una cobertura perfecta (con una incertidumbre estadística del 1%) al utilizar 100 puntos de datos. Así que tenemos validez y optimalidad. ¡Las dos propiedades deseadas de un ci! Tengo muy poco tiempo esos días para actualizar mi respuesta pero me gusta mucho bounty :)
1 votos
@AdrienRenaud - Creo que sin duda te mereces la recompensa por tus esfuerzos. Finalmente me encontré con un paquete de R que hace regresión inversa (investr), pero da resultados diferentes. Si usted está interesado, He aquí una viñeta
0 votos
He incluido investr en mi pequeño estudio. Da el mismo resultado que MIB y CAPITANI-POLLASTRI con 100 puntos de datos (asegúrese de configurar
mean.response=TRUE
al llamar acalibrate
). Para 10 puntos de datos, el ci es diferente y la cobertura de investr es perfecta. Así que investr debería ser la solución preferida.