Para añadir una explicación visual a esto: consideremos algunos puntos que usted planea modelar.
Parece que podrían describirse bien con una línea recta, así que se les ajusta una regresión lineal:
Esta línea de regresión le permite tanto interpolar (generar valores esperados entre sus puntos de datos) como extrapolar (generar valores esperados fuera del rango de sus puntos de datos). He resaltado la extrapolación en rojo y la mayor región de interpolación en azul. Para que quede claro, incluso las pequeñas regiones entre los puntos se interpolan, pero aquí sólo resalto la más grande.
¿Por qué la extrapolación suele ser más preocupante? Porque normalmente se está mucho menos seguro de la forma de la relación fuera del rango de los datos. Piense en lo que podría ocurrir cuando recoja algunos puntos de datos más (círculos huecos):
Resulta que, después de todo, la relación no se captó bien con su relación hipotética. Las predicciones en la región extrapolada están muy lejos. Incluso si hubiera adivinado la función precisa que describe esta relación no lineal correctamente, sus datos no se extendieron sobre un rango suficiente para capturar la no linealidad bien, por lo que todavía puede haber sido bastante lejos. Tenga en cuenta que esto es un problema no sólo para la regresión lineal, sino para cualquier relación; por eso la extrapolación se considera peligrosa.
Las predicciones en la región interpolada también son incorrectas debido a la falta de no linealidad en el ajuste, pero su error de predicción es mucho menor. No hay garantía de que no se produzca una relación inesperada entre los puntos (es decir, la región de interpolación), pero en general es menos probable.
Añadiré que la extrapolación no siempre es una idea terrible: si extrapolas un poco fuera del rango de tus datos, probablemente no te equivocarás mucho (¡aunque es posible!). Los antiguos, que no tenían un buen modelo científico del mundo, no se habrían equivocado mucho si pronosticaban que el sol volvería a salir al día siguiente y al siguiente (aunque un día muy lejano, incluso esto fallará).
Y a veces, la extrapolación puede ser incluso informativa: por ejemplo, las simples extrapolaciones a corto plazo del aumento exponencial del CO $_2$ han sido razonablemente precisos en las últimas décadas. Si se tratara de un estudiante que no tuviera conocimientos científicos pero quisiera una previsión aproximada a corto plazo, esto le habría dado resultados bastante razonables. Pero cuanto más te alejes de los datos que extrapolas, más probable es que tu predicción falle, y que falle de forma desastrosa, como se describe muy bien en este gran hilo: ¿Qué tiene de malo la extrapolación? (gracias a @J.M.isnotastatistician por recordármelo).
Edición basada en los comentarios: tanto si se interpola como si se extrapola, siempre es mejor tener algo de teoría para fundamentar las expectativas. Si la modelización sin teoría debe el riesgo de la interpolación es normalmente menos que la de la extrapolación. Dicho esto, a medida que la brecha entre los puntos de datos aumenta en magnitud, la interpolación también se vuelve más y más cargada de riesgo.