Estoy familiarizado con las transformaciones exponenciales, cuadráticas, de potencia, etc. de las variables en la regresión univariante cuando son necesarias en función de la no normalidad de la relación entre la variable independiente y la dependiente, como la asimetría. Mi pregunta es la siguiente: Si, después de revisar cada relación mediante un diagrama de dispersión entre una variable dependiente y múltiples variables independientes, se determina que se necesitan múltiples y diferentes transformaciones, ¿cómo se determina la ecuación necesaria para transformar los predictores? Por ejemplo, un modelo recíproco puede parecer que se ajusta mejor cuando se compara la VD con la IV_1 y un modelo logarítmico cuando se compara la VD con la IV_2, pero cada transformación requiere una ecuación diferente para la retrotransformación.
D.S.D., muchas gracias por la detallada explicación. Hoy mismo revisaré la web de Whuber. Mi pregunta de seguimiento es la siguiente, si está dispuesto: para transformar los valores predichos a sus unidades de medida originales, ¿tomo la transformación inversa de los coeficientes en la regresión múltiple y luego aplico la ecuación del modelo a los IV originales antes de su transformación? Además, como transformo los predictores y los transformo a la inversa, ¿el intercepto requiere transformación? Me imagino que sí, ya que el intercepto cambiaría en función de las variables transformadas.
1 votos
Es una gran pregunta, pero para hacerle justicia se necesita un libro de texto. Una exposición muy abreviada, centrada en métodos prácticos y exploratorios, está disponible en mi sitio web en quantdec.com/misc/MAT8406/Meeting07 : enlace al archivo PDF de "diagramas de diagnóstico". En 24 páginas muy ilustradas (con mucho trabajo
R
código) Proporciono un flujo de trabajo basado en principios, cuantitativo y eficaz para abordar estos problemas. Está dirigido a las personas que están aprendiendo sobre la regresión múltiple en el nivel superior de la licenciatura hasta el comienzo del posgrado, pero con un mínimo de conocimientos matemáticos.0 votos
Gracias, Whuber. He añadido una pregunta de seguimiento en el comentario debajo de la respuesta de Data Science Dojo, si quieres intervenir allí también.
0 votos
Si su objetivo es construir un modelo predictivo sobre los datos, reservar algunos de ellos para este tipo de análisis exploratorio es una buena idea. Otro enfoque consiste en utilizar bases polinómicas o splines para los predictores, lo que permite aproximar incluso las relaciones curvilíneas no monótonas.
1 votos
Gracias, @Scortchi, en ambas cuentas. Estoy tratando de evitar una regresión basada en polinomios o splines porque no puedo interpretar los modelos con la misma claridad que si fuera una regresión lineal estándar con predictores transformados. De hecho, hace poco me encontré con este problema, ya que no podía interpretar el GAM que había utilizado, que usaba una regresión de placas finas, fuera de mirar la R múltiple del modelo. También tenía un pobre poder predictivo a pesar de tener un buen poder descriptivo. Si tienes alguna idea sobre la pregunta de seguimiento que planteé en un comentario en Data Science Dojo, te estaría muy agradecido.