Tengo un conjunto de datos con 3 variables continuas y 3 variables categóricas. Sé que tengo que crear variables ficticias para las variables categóricas, pero me pregunto si es necesario hacerlo para las 3 variables categóricas en este caso.
Respuestas
¿Demasiados anuncios?Una de las ventajas (entre muchas) de usar R es que se encarga de este problema por usted - no hay necesidad de asignar dummies (sólo asegúrese de que las variables categóricas se introducen como cadenas en lugar de números).
Algunos aspectos básicos: Regresión múltiple en R
R lo hace por ti, como dijo @Julie. Pero también lo hacen SAS y SPSS (y probablemente todos los demás paquetes estadísticos importantes).
Sin embargo, tenga cuidado, ya que los diferentes paquetes tienen diferentes valores por defecto para la forma en que codifican las variables categóricas. En R, véase este documento La codificación dummy es la predeterminada en lm() para los factores no ordenados; lo mismo ocurre en SAS PROC GLM, pero desafortunadamente, PROC LOGISTIC utiliza la codificación de efectos por defecto.