2 votos

¿Qué transformación debe utilizarse cuando se requieren diferentes transformaciones para cada predictor?

Estoy familiarizado con las transformaciones exponenciales, cuadráticas, de potencia, etc. de las variables en la regresión univariante cuando son necesarias en función de la no normalidad de la relación entre la variable independiente y la dependiente, como la asimetría. Mi pregunta es la siguiente: Si, después de revisar cada relación mediante un diagrama de dispersión entre una variable dependiente y múltiples variables independientes, se determina que se necesitan múltiples y diferentes transformaciones, ¿cómo se determina la ecuación necesaria para transformar los predictores? Por ejemplo, un modelo recíproco puede parecer que se ajusta mejor cuando se compara la VD con la IV_1 y un modelo logarítmico cuando se compara la VD con la IV_2, pero cada transformación requiere una ecuación diferente para la retrotransformación.

1 votos

Es una gran pregunta, pero para hacerle justicia se necesita un libro de texto. Una exposición muy abreviada, centrada en métodos prácticos y exploratorios, está disponible en mi sitio web en quantdec.com/misc/MAT8406/Meeting07 : enlace al archivo PDF de "diagramas de diagnóstico". En 24 páginas muy ilustradas (con mucho trabajo R código) Proporciono un flujo de trabajo basado en principios, cuantitativo y eficaz para abordar estos problemas. Está dirigido a las personas que están aprendiendo sobre la regresión múltiple en el nivel superior de la licenciatura hasta el comienzo del posgrado, pero con un mínimo de conocimientos matemáticos.

0 votos

Gracias, Whuber. He añadido una pregunta de seguimiento en el comentario debajo de la respuesta de Data Science Dojo, si quieres intervenir allí también.

0 votos

Si su objetivo es construir un modelo predictivo sobre los datos, reservar algunos de ellos para este tipo de análisis exploratorio es una buena idea. Otro enfoque consiste en utilizar bases polinómicas o splines para los predictores, lo que permite aproximar incluso las relaciones curvilíneas no monótonas.

2voto

nfrost21 Puntos 121

La respuesta corta es que se aplican transformaciones a cada IV individualmente, creando nuevas columnas de IV con relaciones lineales con el VD.

Por ejemplo, si tengo dos IVs $x_1$ y $x_2$ y un DV $y$ , donde $x_1$ tiene una relación exponencial con y (es decir $e^{x_1}~\alpha~y$ ) y $x_2$ tiene una relación cuadrática con y (es decir $x_2^2~\alpha~y$ ), entonces crearé dos nuevos IVs $x_1'$ y $x_2'$ tal que $x_1' = e^{x_1}$ y $x_2' = x_2^2$ . Estos nuevos IVs tienen una relación lineal con $y$ por definición, lo que me permite utilizar un modelo de regresión lineal simple. Para extraer coeficientes útiles de la regresión lineal, basta con aplicar la transformación inversa (ln para $x_1'$ y raíz cuadrada para $x_2'$ ).

La respuesta más larga y completa se encuentra en el enlace del comentario de whuber.

0 votos

D.S.D., muchas gracias por la detallada explicación. Hoy mismo revisaré la web de Whuber. Mi pregunta de seguimiento es la siguiente, si está dispuesto: para transformar los valores predichos a sus unidades de medida originales, ¿tomo la transformación inversa de los coeficientes en la regresión múltiple y luego aplico la ecuación del modelo a los IV originales antes de su transformación? Además, como transformo los predictores y los transformo a la inversa, ¿el intercepto requiere transformación? Me imagino que sí, ya que el intercepto cambiaría en función de las variables transformadas.

0 votos

@A.Vezey: No he podido entender esto: si has transformado las variables independientes, ¿por qué tendrías que transformar los valores predichos de las dependiente ¿variable? - siguen en la escala original.

0 votos

@Scortchi, perdón por la confusión. Por ejemplo, en una transformación de potencia log(y)= b0 + b1log(x), la transformación inversa de los valores predichos es y = 10^(b0 + b1log(x)). Si tengo un predictor que requiere una transformación de potencia y otro que requiere un modelo recíproco, en cuyo caso la transformación inversa es y = 1 / ( b0 + b1x ), ¿cómo hago para completar la transformación inversa de los valores predichos? ¿Tiene más sentido?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X