4 votos

Escala de datos categóricos en la regresión

Parece impar escalar una variable categórica, pero necesito obtener los coeficientes correctos para cada una de mis variables en la regresión lineal. ¿Es correcto escalar de la misma forma que lo haría con variables continuas, o qué es lo correcto en este caso?

Por ejemplo, si x es categórica e y es continua:

model=lm(DV ~ scale(x) + scale(y), data=myData)

¿Es lo correcto?

3voto

Zizzencs Puntos 1358

En un comentario escribes:

Según tengo entendido, si no escalas, entonces las betas/coeficiente no tienen sentido.

esto no es correcto. Tienen significado, sólo que es un significado diferente. Si se utilizan las unidades originales, entonces los coeficientes se refieren a las unidades originales. A menudo, esto es lo que quieres. Si escalas, entonces los coeficientes son sobre las unidades escaladas - a menudo desviación estándar - a veces esto es lo que quieres. Las opiniones difieren en cuanto a la frecuencia de la escala, la conveniencia de la escala, etc.

Escalar una variable categórica no tiene mucho sentido. Ni siquiera está claro cuál sería. Las variables categóricas tienen que parametrizarse, a menudo mediante codificación ficticia (aunque son posibles otros esquemas).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X