¿Un valor negativo de la intersección sugiere que la línea de regresión no se ajusta bien a los datos? ¿Por qué? ¿Y por qué no?
Respuestas
¿Demasiados anuncios?No, un valor negativo de intercepción no sugiere que la línea de regresión proporcione un "ajuste pobre a los datos". ¿Por qué no? Porque la intercepción no es una medida de ajuste para una regresión. Es un valor que representa un elemento del modelo, no la calidad del ajuste.
La bondad de ajuste de un modelo estadístico describe qué tan bien se ajusta a un conjunto de observaciones. Las medidas de bondad de ajuste generalmente resumen la discrepancia entre los valores observados y los valores esperados bajo el modelo en cuestión. WP:EN s.v. Goodness of fit
[...] intercepto en y o intercepto vertical es un punto donde la gráfica de una función o relación intersecta el eje y del sistema de coordenadas. WP:EN s.v. y-intercept
Ver la respuesta de KDG para una ilustración.
Como otros han dicho, la intercepción no es en absoluto una medida de ajuste, por lo que una intercepción negativa no indica un mal ajuste. Pero -- preguntaste si una intercepción negativa sugiere un mal ajuste. En algunos contextos, la respuesta es claramente "sí". Si $X$ y $Y$ son cantidades físicas tales que $Y < 0$ no tiene sentido físico, y además los valores de $X$ cercanos a 0 no son valores atípicos que forman parte de tu conjunto de datos, entonces un modelo lineal $Y = mX + b$ con $b < 0$ (por una cantidad significativa) no será un buen modelo para tus datos. Ten en cuenta que dicho modelo tendrá residuos grandes para aquellos valores de $X$ cercanos a 0, por lo que la pobreza del ajuste se mostrará en las medidas estándar.
Pero en otros contextos, una intercepción negativa no es problemática incluso si $Y < 0$ no tiene sentido. Como ejemplo, el conjunto de datos de muestra integrado en R trees proporciona la altura, el volumen y el diámetro de 31 árboles de cerezo negro. Si haces una regresión lineal del volumen como función del diámetro (lm(formula = Volume ~ Girth, data = trees)
) obtendrás un modelo lineal con una intercepción negativa. El ajuste no es malo (aunque un modelo cuadrático sería mejor) con $R^2 = 0.93$. Podrías usarlo para obtener predicciones razonables del volumen de un árbol de este tipo en función de su diámetro. En este caso, la intercepción negativa simplemente indica que es poco razonable extrapolar una relación que se mantiene (aproximadamente) entre árboles maduros a meros renuevos. Pero - no necesitas una intercepción negativa para decirte que tal extrapolación es problemática. No confiaría en ningún modelo físico con $X$ cerca de 0 a menos que los propios datos involucren tales valores.
El valor de la intercepción no tiene relación con la bondad del ajuste.
Para averiguar si una línea de ajuste es buena para los datos, es necesario calcular la distancia entre la línea de ajuste y todos los puntos de datos (como se muestra en la respuesta de @KDG).
Una métrica para calcular esto es Error Cuadrático Medio (RMSE).
13 votos
La redacción de tu pregunta implica que tienes alguna razón para creer que la premisa puede ser cierta. ¿Por qué? ¿Qué te hace preguntar eso? (Pregunto porque sospecho que puede haber un problema más profundo debajo de este que debería aclararse, posiblemente indicando la inadecuación de un modelo de regresión lineal para lo que estás pensando)
1 votos
Si no te gustan las intercepciones negativas, simplemente niega la variable de respuesta. Eso no cambiará la linealidad (es decir, la bondad del ajuste) de ningún modelo, pero producirá una intercepción positiva.
0 votos
A menos que sea una variable donde un valor negativo no tenga sentido.
0 votos
¿Has encontrado útiles las respuestas? ¿Has considerado votar y aceptar una respuesta? Si encuentras que nadie proporciona una respuesta satisfactoria a tu pregunta, es posible que desees considerar editar tu(s) pregunta(s) para proporcionar más información clara sobre la naturaleza del problema. Si notas que tu pregunta no está recibiendo buenas respuestas y deseas motivar a quienes responden, podrías considerar comenzar una recompensa para esta pregunta.
0 votos
@m-nazir ¿Has abandonado tu pregunta?