¿Cómo calcular el intervalo de confianza de la intersección x en una regresión lineal?

Question

¿Cómo calcular el intervalo de confianza de la intersección x en una regresión lineal?

Preguntado el 1 de Julio, 2016: Cuando se hizo la pregunta
193 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Dado que el error estándar de una regresión lineal se suele dar para la variable de respuesta, me pregunto cómo obtener intervalos de confianza en la otra dirección, por ejemplo, para una intersección x. Soy capaz de visualizar lo que podría ser, pero estoy seguro de que debe haber una forma sencilla de hacerlo. Soy capaz de visualizar lo que podría ser, pero estoy seguro de que debe haber una manera directa de hacer esto. A continuación se muestra un ejemplo en R de cómo visualizar esto:

set.seed(1)
x <- 1:10
a <- 20
b <- -2
y <- a + b*x + rnorm(length(x), mean=0, sd=1)

fit <- lm(y ~ x)
XINT <- -coef(fit)[1]/coef(fit)[2]

plot(y ~ x, xlim=c(0, XINT*1.1), ylim=c(-2,max(y)))
abline(h=0, lty=2, col=8); abline(fit, col=2)
points(XINT, 0, col=4, pch=4)
newdat <- data.frame(x=seq(-2,12,len=1000))

# CI
pred <- predict(fit, newdata=newdat, se.fit = TRUE) 
newdat$yplus <-pred$fit + 1.96*pred$se.fit 
newdat$yminus <-pred$fit - 1.96*pred$se.fit 
lines(yplus ~ x, newdat, col=2, lty=2)
lines(yminus ~ x, newdat, col=2, lty=2)

# approximate CI of XINT
lwr <- newdat$x[which.min((newdat$yminus-0)^2)]
upr <- newdat$x[which.min((newdat$yplus-0)^2)]
abline(v=c(lwr, upr), lty=3, col=4)

Preguntado el 1 de Julio, 2016 por Jake

1 votos

Podrías arrancar esto: library(boot); sims <- boot(data.frame(x, y), function(d, i) { fit <- lm(y ~ x, data = d[i,]) -coef(fit)[1]/coef(fit)[2] }, R = 1e4); points(quantile(sims$t, c(0.025, 0.975)), c(0, 0)) . Para los intervalos de predicción inversa, véase el archivo de ayuda de chemCal:::inverse.predict da la siguiente referencia que también podría ayudar a derivar un IC: Massart, L.M, Vandenginste, B.G.M., Buydens, L.M.C., De Jong, S., Lewi, P.J., Smeyers-Verbeke, J. (1997) Handbook of Chemometrics and Qualimetrics: Parte A, p. 200

Comentado el 1 de Julio, 2016 por Roland

0 votos

@Roland - Gracias por esto. Muy útil. ¿Alguna idea de por qué la rutina bootstrap produce intervalos notablemente más estrechos que el método que muestro?

Comentado el 1 de Julio, 2016 por Jake

1 votos

Lo que muestra en el gráfico no es el IC para el intercepto. Muestras los puntos donde las líneas de confianza inferior y superior de las predicciones cruzan el eje.

Comentado el 1 de Julio, 2016 por Roland

Mostrar 13 comentarios más

Answer 1

2 Respuestas

Answer 2

10voto

Adrien Renaud Puntos 126

¿Cómo calcular el intervalo de confianza de la intersección x en una regresión lineal?

Supuestos

Utilizar el modelo de regresión simple $y_i = \alpha + \beta x_i + \varepsilon_i$ .
Los errores tienen una distribución normal condicionada a los regresores $\epsilon | X \sim \mathcal{N}(0, \sigma^2 I_n)$
Ajuste mediante mínimos cuadrados ordinarios

3 procedimientos para calcular el intervalo de confianza de la intersección x

Ampliación Taylor (fácil de usar)
Método Marc in the box (MIB)
CAPITANI-POLLASTRI ( https://boa.unimib.it/retrieve/handle/10281/43053/64388/DECAPITANI_Pollastri.pdf )

Expansión de Taylor de primer orden

Su modelo es $Y=aX+b$ con desviación típica estimada $\sigma_a$ y $\sigma_b$ en $a$ y $b$ parámetros y covarianza estimada $\sigma_{ab}$ . Usted resuelve

$aX+b=0 \Leftrightarrow X= \frac{-b} a.$

Entonces la desviación típica $\sigma_X$ en $X$ viene dado por:

$\left( \frac {\sigma_X} X \right)^2 = \left( \frac {\sigma_b} b \right)^2 + \left( \frac {\sigma_a} a \right)^2 - 2 \frac{\sigma_{ab}}{ab}.$

MIB

Ver código de Marc en la caja en ¿Cómo calcular el intervalo de confianza de la intersección x en una regresión lineal? .

CAPITANI-POLLASTRI

CAPITANI-POLLASTRI proporciona la Función de Distribución Acumulativa y la Función de Densidad para el cociente de dos variables aleatorias Normales correlacionadas. Puede utilizarse para calcular el intervalo de confianza de la intersección x en una regresión lineal. Este procedimiento da resultados (casi) idénticos a los de MIB.

Efectivamente, utilizando mínimos cuadrados ordinarios y asumiendo la normalidad de los errores, $\hat\beta \sim \mathcal{N}(\beta, \sigma^2 (X^TX)^{-1})$ (verificado) y $\hat{\beta}$ están correlacionadas (verificadas).

El procedimiento es el siguiente:

obtener el estimador OLS para $a$ y $b$ .
obtener la matriz de varianza-covarianza y extraer, $\sigma_a, \sigma_b, \sigma_{ab}=\rho\sigma_a\sigma_b$ .
Supongamos que $a$ y $b$ siguen una distribución Normal Correlacionada Bivariada, $\mathcal{N}(a, b, \sigma_a, \sigma_b, \rho)$ . A continuación, la función de densidad y la función de distribución acumulativa de $x_{intercept}= \frac{-b}{a}$ vienen dadas por CAPITANI-POLLASTRI.
Utilice la función de distribución acumulativa de $x_{intercept}= \frac{-b}{a}$ para calcular los cuantiles deseados y establecer un intervalo de cofianza.

Comparación de los 3 procedimientos

Los procedimientos se comparan utilizando la siguiente configuración de datos:

x <- 1:10
a <- 20
b <- -2
y <- a + b*x + rnorm(length(x), mean=0, sd=1)

Se generan 10000 muestras diferentes y se analizan utilizando los 3 métodos. El código (R) utilizado para generar y analizar se puede encontrar en: https://github.com/adrienrenaud/stackExchange/blob/master/crossValidated/q221630/answer.ipynb

MIB y CAPITANI-POLLASTRI dan resultados equivalentes.
La expansión de Taylor de primer orden difiere significativamente de los otros dos métodos.
MIB y CAPITANI-POLLASTRI sufre de subcobertura. El 68% (95%) ci contiene el valor verdadero el 63% (92%) de las veces.
La expansión de Taylor de primer orden sufre un exceso de cobertura. La ci del 68% (95%) contiene el valor verdadero el 87% (99%) de las veces.

Conclusiones

La distribución del intersticio x es asimétrica. Justifica un intervalo de confianza asimétrico. MIB y CAPITANI-POLLASTRI dan resultados equivalentes. CAPITANI-POLLASTRI tiene una buena justificación teórica y da fundamentos para MIB. MIB y CAPITANI-POLLASTRI sufren una moderada falta de cobertura y pueden utilizarse para establecer intervalos de confianza.

Respondido el 2 de Julio, 2016 por Adrien Renaud (126 Puntos )

0 votos

Gracias por esta buena respuesta. ¿Implica este método que el error estándar de la intersección x es simétrico? Los intervalos de predicción de mi figura implican que no es así, y he visto referencias a esto en otros sitios.

Comentado el 4 de Julio, 2016 por Jake

0 votos

Sí, implica un intervalo simétrico. Si quieres uno asimétrico, podrías utilizar un perfil de probabilidad tratando los parámetros de tu modelo como parámetros molestos. Pero es más trabajo :)

Comentado el 4 de Julio, 2016 por Adrien Renaud

0 votos

¿Podría explicar con más detalle cómo obtiene esa expresión para $(\sigma_X/X)^2$ ?

Comentado el 12 de Septiembre, 2016 por Usuario no registrado

Mostrar 1 comentarios más

Answer 3

3voto

Roland Puntos 2023

Yo recomendaría el bootstrapping de los residuos:

library(boot)

set.seed(42)
sims <- boot(residuals(fit), function(r, i, d = data.frame(x, y), yhat = fitted(fit)) {

  d$y <- yhat + r[i]

  fitb <- lm(y ~ x, data = d)

  -coef(fitb)[1]/coef(fitb)[2]
}, R = 1e4)
lines(quantile(sims$t, c(0.025, 0.975)), c(0, 0), col = "blue")

Lo que se muestra en el gráfico son los puntos en los que el límite inferior/superior de la banda de confianza de las predicciones cruza el eje. No creo que sean los límites de confianza del intercepto, pero quizá sean una aproximación.

Respondido el 1 de Julio, 2016 por Roland (2023 Puntos )

0 votos

Genial, esto ya parece más razonable que el ejemplo de tu comentario. Gracias de nuevo.

Comentado el 1 de Julio, 2016 por Jake

¿Cómo calcular el intervalo de confianza de la intersección x en una regresión lineal?

Respuestas

¿Cómo calcular el intervalo de confianza de la intersección x en una regresión lineal?

Supuestos

3 procedimientos para calcular el intervalo de confianza de la intersección x

Expansión de Taylor de primer orden

MIB

CAPITANI-POLLASTRI

Comparación de los 3 procedimientos

Conclusiones

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cómo calcular el intervalo de confianza de la intersección x en una regresión lineal?

Respuestas

¿Cómo calcular el intervalo de confianza de la intersección x en una regresión lineal?

Supuestos

3 procedimientos para calcular el intervalo de confianza de la intersección x

Expansión de Taylor de primer orden

MIB

CAPITANI-POLLASTRI

Comparación de los 3 procedimientos

Conclusiones

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: