Estoy aprendiendo acerca de la máquina de aprendizaje usando Python biblioteca del scikit aprender, y en su tutorial aquí se habla de una variable categórica color
que pueden tener valores purple
, blue
y red
.
¿Cuál es la razón detrás de usar 3 variables booleanas color#purple
, color#blue
y color#red
, en lugar de tener la única variable color
, pero la asignación de los valores de purple
, blue
, red
a 1
, 2
, 3
?
Va a hacer de cualquier manera tienen efecto alguno sobre la regresión de ajuste/predicción?