2 votos

Cómo encontrar características importantes en este problema

Estaba pensando en cómo se pueden aplicar las técnicas de ML en el sector minorista. Supongamos que tenemos datos de un minorista que se ocupa de la ropa y la ropa en este formato y para cada artículo hay características predefinidas, por ejemplo, una camisa tendrá características como el color, las mangas medias/completas, etc. Quiero saber cómo extraer las características importantes de los "artículos más vendidos" de estos datos. Por ejemplo, si encuentro que las camisas son el artículo más vendido, entonces qué tipo de camisa: de color negro, de media manga, etc.

Estaba pensando en utilizar árboles de decisión en este caso. No estoy seguro de que sea un buen enfoque.

1voto

robertevansanders Puntos 223

El lazo parece que sería bueno. Lasso (Least Absolute Shrinkage and Selection Operator) es como OLS, pero penaliza la "longitud" de los coeficientes finales incluyendo un término "regularizador".

El documento actual es Tibshirani (1996).

El paquete Lasso y la demostración en R es http://cran.r-project.org/web/packages/genlasso/vignettes/article .

El lazo es genial porque penaliza un gran número de coeficientes para que sean exactamente cero, y se puede ajustar el parámetro de sintonía para ver lo que cae primero y se mantiene a medida que se hace más estricto en el aprendizaje de características relevantes.

EDITAR:

Pero, como decía el comentarista, hay que tener cuidado con lo que se aprende realmente de un modelo. Además, si eres una empresa grande y empiezas a cambiar tu producción... ten en cuenta https://en.wikipedia.org/wiki/Campbell%27s_law

0voto

bortzmeyer Puntos 111

Simplemente obtenga los datos, decida cómo quiere definir los grupos de características (colores por tipo de camisa, o tipo de camisa por separado, colores por separado, etc' ) y codifique las características de los temas utilizando sci-kit learn.

http://scikit-learn.org/stable/modules/preprocessing.html#encoding-categorical-features

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X