28 votos

Contrastes polinómicos para la regresión

No consigo entender el uso de contrastes polinómicos en el ajuste de regresión. En concreto, me refiero a una codificación utilizada por R para expresar una variable de intervalo (variable ordinal con niveles igualmente espaciados), descrita en esta página .

En el ejemplo de esa página Si he entendido bien, R ajusta un modelo para una variable de intervalo, devolviendo unos coeficientes que ponderan su tendencia lineal, cuadrática o cúbica. Por lo tanto, el modelo ajustado debería ser:

$${\rm write} = 52.7870 + 14.2587X - 0.9680X^2 - 0.1554X^3,$$

donde $X$ deben tomar valores $1$ , $2$ , $3$ o $4$ según el diferente nivel de la variable de intervalo.

¿Es correcto? Y, si es así, ¿cuál era el propósito de los contrastes polinómicos?

7voto

Abjs Puntos 21

Utilizaré tu ejemplo para explicar cómo funciona. Utilizando contrastes polinómicos con cuatro grupos se obtiene lo siguiente.

\begin{align} E\,write_1 &= \mu -0.67L + 0.5Q -0.22C\\ E\,write_2 &= \mu -0.22L -0.5Q + 0.67C\\ E\,write_3 &= \mu + 0.22L -0.5Q -0.67C\\ E\,write_4 &= \mu + 0.67L + 0.5Q + 0.22C \end{align}

Donde la primera ecuación funciona para el grupo de puntuaciones de lectura más bajas y la cuarta para el grupo de mejores puntuaciones de lectura. podemos comparar estas ecuaciones con la dada usando regresión lineal normal (suponiendo que $read_i$ es continua)

$$E\,write_i=\mu+read_iL + read_i^2Q+read_i^3C$$

Por lo general, en lugar de $L,Q,C$ tendrías $\beta_1, \beta_2, \beta_3$ y escrito en primera posición. Pero esta escritura se parece a la de los contrastes polinómicos. Así que los números delante de $L, Q, C$ son en realidad en lugar de $read_i, read_i^2, read_i^3$ . Se puede ver que los coeficientes antes de $L$ tienen tendencia lineal, antes $Q$ cuadrática y antes $C$ cúbico.

A continuación, R estima los parámetros $\mu, L,Q,C$ y te da $$ \widehat{\mu}=52.79, \widehat{L}=14.26, \widehat{Q}=−0.97, \widehat{C}=−0.16 $$ Dónde $\widehat{\mu}=\frac{1}{4}\sum_{i=1}^4E\,write_i$ y los coeficientes estimados $\widehat{\mu}, \widehat{L}, \widehat{Q}, \widehat{C}$ son algo así como estimaciones en regresión lineal normal. Así que a partir de la salida se puede ver si los coeficientes estimados son significativamente diferentes de cero, por lo que podría anticipar algún tipo de tendencia lineal, cuadrática o cúbica.

En ese ejemplo es significativamente distinto de cero sólo $\widehat{L}$ . Así que su conclusión podría ser: Vemos que la mejor puntuación en escritura depende linealmente de la puntuación en lectura, pero no hay un efecto cuadrático o cúbico significativo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X