1 votos

¿Debo estandarizar (z-score) las características que ya están en el rango [0,1]?

Tengo un conjunto de datos que me gustaría utilizar para entrenar modelos SVM. El conjunto de datos contiene variables binarias, así como variables que están en el rango [0,1] (es decir, representan proporciones calculadas dividiendo una medida de tipo ratio por otra medida de tipo ratio).

Dado que los valores de todas las variables/características caen en el rango [0,1], ¿todavía tengo que estandarizarlas (puntuación z) (es decir, alguna/ambas de las binarias y de proporción)?

1voto

Johnny Puntos 151

Si todo lo que sabes es que estas variables están delimitadas entre 0 y 1, entonces yo seguiría dándoles una puntuación z, porque todavía podrían tener medias y varianzas bastante diferentes. Si además tiene razones para creer que esas medias y varianzas son también muy similares, podría renunciar a la estandarización. Pero, de nuevo, ¿qué se gana al no hacer la puntuación z?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X