Estoy utilizando Matlab, tengo un $600 \times 9$ en la que cada fila representa las 9 características que intento evaluar mediante regresión logística.
-
Entiendo que tengo que escalar las características, pero ¿tengo que hacerlo tanto en el conjunto de entrenamiento como en el de pruebas?
-
Tengo 9 características, ¿hasta qué grado debo realizar la regularización?... ¿hasta qué grado de orden superior para 9 características debo tener en cuenta?
-
¿Cómo puedo comprobar qué funciones contribuyen más o menos?
-
¿Cómo divido mi conjunto de entrenamiento y de pruebas, qué proporción es la más idónea?