Estoy pensando en un problema que es predecir log(gasto) de un cliente mediante regresión lineal.
Estoy pensando en qué características se utiliza como entrada y se preguntaba si sería ACEPTAR para utilizar el percentil de una variable como entradas.
Por ejemplo, podría utilizar las empresas de los ingresos como de entrada. Lo que me pregunto es si yo podría utilizar los ingresos de la compañía percentiles.
Otro ejemplo sería el de una categórica de la industria de la clasificador (NAICS) - si yo fuera a mirar en la mediana de pasar por código NAICS y, a continuación, asignar a cada código NAICS a un 'NAICS Percentil', que sería válido variable explicativa podría utilizar?
Sólo me preguntaba si hay alguna de las cuestiones a tener en cuenta cuando se utilizan los percentiles? Es que en algunas formas equivalente a un tipo de función de escalamiento?