Me gustaría utilizar algún análisis multivariante para mis datos. Mis datos no se distribuyen normalmente, por lo que hice una transformación logarítmica para obtener una distribución normal. Si es así, ¿debo utilizar mis datos originales o los datos transformados logarítmicamente?
Respuestas
¿Demasiados anuncios?
Amadiere
Puntos
5606
Tienes que hacer lo correcto .
- hay conjuntos de datos en los que lo correcto es normalizar
- hay conjuntos de datos en los que lo correcto es estandarizar
- hay conjuntos de datos en los que lo correcto es rotar mediante PCA
- hay conjuntos de datos en los que es correcto blanquear usando PCA
- hay conjuntos de datos en los que lo correcto es blanquear y mantener sólo los componentes superiores
- hay conjuntos de datos en los que lo correcto es hacer cosas diferentes en diferentes atributos ( muy común )
- hay conjuntos de datos en los que lo correcto es no hacer nada de lo anterior
La mala noticia es que no existe un método de "si esto, entonces aquello" para averiguarlo. Se necesita experiencia, entender los fundamentos matemáticos y las consecuencias. Y hay que conocer los datos. Como no tenemos tus datos, no sabemos qué está bien o mal.
Jack Wills
Puntos
13