9 votos

El uso de los percentiles como predictores - buena idea?

Estoy pensando en un problema que es predecir log(gasto) de un cliente mediante regresión lineal.

Estoy pensando en qué características se utiliza como entrada y se preguntaba si sería ACEPTAR para utilizar el percentil de una variable como entradas.

Por ejemplo, podría utilizar las empresas de los ingresos como de entrada. Lo que me pregunto es si yo podría utilizar los ingresos de la compañía percentiles.

Otro ejemplo sería el de una categórica de la industria de la clasificador (NAICS) - si yo fuera a mirar en la mediana de pasar por código NAICS y, a continuación, asignar a cada código NAICS a un 'NAICS Percentil', que sería válido variable explicativa podría utilizar?

Sólo me preguntaba si hay alguna de las cuestiones a tener en cuenta cuando se utilizan los percentiles? Es que en algunas formas equivalente a un tipo de función de escalamiento?

1voto

Łukasz Bownik Puntos 2170

Si su modelo implica algún tipo de concurso en la firma de los ingresos, puede usar el percentil. Registro percentil parece más significativo, de cuantiles no va a ser lineal en el valor, o eso me imagino.

En esta historia, que incluyen ln(%) de empresas con ingresos bajo la observación de la firma. La historia es que, con altos ingresos tienen una reputación que son mejores que los de las empresas con bajos ingresos, y esta relación de "tener más que la competencia" es relevante, pero no el nivel de ingresos de la misma. Yo podría ver esto como una parte importante de la firma y reconocimiento de marca.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X