Estoy buscando un estudio de caso avanzado de regresión lineal que ilustre los pasos necesarios para modelar relaciones no lineales complejas y múltiples usando GLM o OLS. Es sorprendentemente difícil encontrar recursos que vayan más allá de ejemplos básicos de la escuela: la mayoría de los libros que he leído no van más allá de una transformación logarítmica de la respuesta combinada con un BoxCox de un predictor, o un spline natural en el mejor de los casos. Además, todos los ejemplos que he visto hasta ahora abordan cada problema de transformación de datos en un modelo aparte, a menudo en un modelo de un solo predictor.
Sé lo que es una transformación BoxCox o YeoJohnson. Lo que estoy buscando es un estudio de caso detallado y de la vida real donde la respuesta/relación no sean claras. Por ejemplo, la respuesta no es estrictamente positiva (por lo que no se puede usar logaritmo o BoxCox), los predictores tienen relaciones no lineales entre sí y contra la respuesta, y las transformaciones de datos de máxima verosimilitud no parecen implicar un exponente estándar de 0,33 o 0,5. Además, se encuentra que la varianza residual no es constante (nunca lo es), por lo que la respuesta también debe ser transformada y se tendrán que tomar decisiones entre una regresión de familia GLM no estándar o una transformación de respuesta. El investigador probablemente tomará decisiones para evitar el sobreajuste de los datos.
EDITAR
Hasta ahora he recopilado los siguientes recursos:
- Estrategias de Modelado de Regresión, F. Harrell
- Series Temporales Econometría Aplicada, W. Enders
- Modelos Lineales Dinámicos con R, G. Petris
- Análisis de Regresión Aplicada, D. Kleinbaum
- Una Introducción al Aprendizaje Estadístico, G. James/D. Witten
Sólo he leído el último (ISLR) y es un texto muy bueno (cinco estrellas en mi opinión), aunque más orientado hacia el aprendizaje automático que hacia el modelado de regresión avanzado.
También hay este buen post en CV que presenta un caso de regresión desafiante.
8 votos
Creo que el libro de Frank Harrells (amazon.com/…) podría ser útil.
0 votos
@AdamRobinsson Veo que la tabla de contenido abarca varios temas relevantes (modelos multivariables, splines, multicolinealidad), pero ¿se ilustran esas metodologías juntas en un ejemplo de la vida real o se explica cada tema por separado? Porque normalmente en ejemplos de la vida real todos los problemas te llegan al mismo tiempo y nunca es obvio cómo gestionarlos bien.
1 votos
Todavía no he leído todo el libro, pero las primeras 150 páginas han sido absolutamente geniales (no soy un estadístico, solo un entusiasta). Los ejemplos son extensos y detallados. El libro está acompañado por el paquete RMS (estrategias de modelado de regresión) para R. También he revisado el libro competidor de David Kleinbaum (desafortunadamente olvidé el título) pero contenía mucho menos sobre estrategias y ejemplos (y era el doble de caro).
0 votos
Sí, los estudios de caso son realísticamente complejos y se siguen de principio a fin.
0 votos
@Scortchi Bueno saberlo. ¡Parece que esa es la única opción!
0 votos
@RobertKubrick: No recuerdo ningún ejemplo de regresión multivariante en RMS, ¿pero es eso (es decir, múltiples respuestas) lo que quieres decir de todos modos?
0 votos
@Scortchi No, regresión multivariante, una sola respuesta.
3 votos
@RobertKubrick: "Regresión multivariada" significa con más de una respuesta (consulte la wiki para la etiqueta que agregaste, o aquí). "Regresión múltiple" significa con más de un predictor.
3 votos
Es posible que quieras echar un vistazo a Applied Econometric Time Series de Enders. La nueva versión cubre modelos no lineales hacia el final del libro. Casi todos los datos están disponibles públicamente en el sitio web de la Reserva Federal de St. Louis (accesible a través de quantmod en R), por lo que puedes seguir ejemplos de la vida real. Dynamic Linear Models with R también tiene algunos ejemplos con datos reales que son bastante decentes.
0 votos
Prueba Applied Regression Analysis por David Kleinbaum, que creo que es a lo que Adam Robinsson se refería.