13 votos

B-Splines VS polinomios de alto orden en regresión

No tengo en mente ningún ejemplo o tarea específica. Sólo soy nuevo en el uso de b-splines y quería obtener una mejor comprensión de esta función en el contexto de regresión.

Supongamos que queremos evaluar la relación entre la variable de respuesta $y$ y algunos predictores $x_1, x_2,...,x_p$ . Los predictores incluyen algunas variables numéricas y otras categóricas.

Supongamos que tras ajustar un modelo de regresión, una de las variables numéricas, por ejemplo $x_1$ es significativo. Un paso lógico posterior es evaluar si los polinomios de orden superior, por ejemplo: $x_1^2$ y $x_1^3$ para explicar adecuadamente la relación sin sobreajustar.

Mis preguntas son:

  1. ¿En qué momento hay que elegir entre b-splines o un polinomio simple de orden superior, por ejemplo en R?

    y ~ poly(x1,3) + x2 + x3

    vs

     y ~ bs(x1,3) + x2 + x3
  2. ¿Cómo se pueden utilizar los gráficos para decidir entre una u otra opción y qué ocurre si no queda claro a partir de los gráficos (por ejemplo, debido a la gran cantidad de puntos de datos)?

  3. ¿Cómo evaluaría los términos de interacción bidireccional entre $x_2$ y digamos $x_3$

  4. ¿Cómo cambia lo anterior para los distintos tipos de modelos?

  5. ¿Considerarías no utilizar nunca polinomios de alto orden y ajustar siempre b-splines y penalizar la alta flexibilidad?

12 votos

Escribí extensamente sobre esto aquí: madrury.github.io/jekyll/update/statistics/2017/08/04/

1 votos

Dado lo bien desarrollado mgcv es, por qué no utilizar modelos aditivos (generalizados). La selección de la suavidad es automática y los métodos inferenciales están bien desarrollados.

20voto

icelava Puntos 548

Normalmente sólo consideraría splines en lugar de polinomios. Los polinomios no pueden modelar umbrales y a menudo son indeseablemente globales, es decir, las observaciones en un rango del predictor tienen una fuerte influencia en lo que hace el modelo en un rango diferente ( Magee, 1998, El Estadístico Americano y Frank Harrell Estrategias de modelización de la regresión ). Y, por supuesto, los splines restringidos que son lineales fuera de los nudos extremos son mejores para la extrapolación, o incluso la intrapolación en valores extremos de los predictores.

Uno de los casos en los que se pueden considerar los polinomios es cuando es importante explicar el modelo a un público no técnico. La gente entiende mejor los polinomios que las splines. (Editar: Matthew Drury señala que la gente sólo puede piense en entienden mejor los polinomios que los splines. No voy a tomar partido en esta cuestión).

Los gráficos no suelen ser muy útiles para decidir entre distintas formas de tratar la no linealidad. Es mejor hacer una validación cruzada. Esto también le ayudará a evaluar las interacciones, o encontrar una buena penalización.

Por último, mi respuesta no cambia con el tipo de modelo, porque los puntos anteriores son válidos para cualquier modelo estadístico o ML.

0 votos

Muchas gracias por tu respuesta, me ha sido de gran ayuda. Sólo una pregunta rápida de seguimiento. ¿Existe alguna forma "moderna" de encontrar los nudos? Mi mejor suposición sería 1) Utilizar la intuición, por ejemplo: si la variable representa el tiempo en términos de meses, ¿utilizar nodos cada 6 ó 12? 2) Introducir una secuencia que recorra el rango de la variable y utilizar la validación cruzada para encontrar los nodos óptimos, ¿quizás?

9 votos

Personas piense en entienden mejor los polinomios que las splines.

3 votos

En cuanto a la colocación de los nudos: la validación cruzada es un enfoque, pero para ser honesto, creo que los resultados serán bastante insensibles a conocer la colocación, siempre y cuando los nudos se coloquen razonablemente y no se agrupen demasiado. Frank Harrell tiene una tabla con colocaciones heurísticas de nudos en términos de cuantiles de la distribución del predictor en Estrategias de modelización de la regresión .

8voto

probob Puntos 11

En la sección 7.4.5 de "The Elements of Statistical Learning", se dice que los splines suelen dar resultados superiores a la regresión polinómica, porque:

  • Produce ajustes flexibles;
  • Produce estimaciones más estables;
  • Los polinomios pueden producir resultados no deseados en los límites.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X