18 votos

Transformación inversa de los coeficientes de regresión

Estoy haciendo una regresión lineal con una variable dependiente transformada. La siguiente transformación se hizo para que la hipótesis de normalidad de los residuos se mantuviera. La variable dependiente sin transformar estaba sesgada negativamente, y la siguiente transformación la hizo cercana a la normalidad:

$$Y=\sqrt{50-Y_{orig}}$$

donde $Y_{orig}$ es la variable dependiente en la escala original.

Creo que tiene sentido utilizar alguna transformación en el $\beta$ para volver a la escala original. Utilizando la siguiente ecuación de regresión,

$$Y=\sqrt{50-Y_{orig}}=\alpha+\beta \cdot X$$

y fijando $X=0$ tenemos

$$\alpha=\sqrt{50-Y_{orig}}=\sqrt{50-\alpha_{orig}}$$

Y por último,

$$\alpha_{orig}=50-\alpha^2$$

Usando la misma lógica, encontré

$$\beta_{orig}=\alpha\space(\alpha-2\beta)+\beta^2+\alpha_{orig}-50$$

Ahora las cosas funcionan muy bien para un modelo con 1 o 2 predictores; los coeficientes retrotransformados se parecen a los originales, sólo que ahora puedo confiar en los errores estándar. El problema viene cuando se incluye un término de interacción, como

$$Y=\alpha+X_1\beta_{X_1}+X_2\beta_{X_2}+X_1X_2\beta_{X_1X_2}$$

A continuación, la retrotransformación para el $\beta$ s no están tan cerca de los de la escala original, y no estoy seguro de por qué ocurre eso. Tampoco estoy seguro de si la fórmula encontrada para la retrotransformación de un coeficiente beta es utilizable tal cual para la 3ª $\beta$ (para el término de interacción). Antes de entrar en el álgebra loca, pensé en pedir consejo...

19voto

Niall Puntos 51

Un problema es que has escrito

$$Y=α+β⋅X$$

Se trata de un modelo determinista simple (es decir, no aleatorio). En ese caso, usted podría volver a transformar los coeficientes en la escala original, ya que es cuestión de un poco de álgebra simple. Pero, en la regresión habitual sólo tienes $E(Y|X)=α+β⋅X $ ; has dejado el término de error fuera de tu modelo. Si la transformación de $Y$ volver a $Y_{orig}$ es no lineal, puede tener un problema ya que $E\big(f(X)\big)≠f\big(E(X)\big)$ En general. Creo que eso puede tener que ver con la discrepancia que estás viendo.

Editar: Tenga en cuenta que si la transformación es lineal, puede realizar una retrotransformación para obtener estimaciones de los coeficientes en la escala original, ya que la expectativa es lineal.

15voto

Sean Hanley Puntos 2428

Aplaudo tus esfuerzos, pero estás ladrando al árbol equivocado. Usted no respalda las betas transformadas. Su modelo se mantiene en el mundo de los datos transformados. Si quieres hacer una predicción, por ejemplo, transformas hacia atrás $\hat{y}_i$ pero eso es todo. Por supuesto, también se puede obtener un intervalo de predicción calculando los valores límite alto y bajo, y luego transformarlos hacia atrás también, pero en ningún caso se transforman hacia atrás las betas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X