1 votos

¿Cómo puedo utilizar patrones de análisis de datos para crear un modelo de aprendizaje automático predictivo?

Intento crear un modelo predictivo que pueda predecir lo bien que se venderá un producto en el futuro en función de determinados parámetros. He hecho algunas visualizaciones que muestran la relación entre los datos. La visualización muestra que hay una clara relación entre el calor que hace fuera y la cantidad de ventas de un determinado producto.

Tengo datos de 10 años sobre las ventas semanales de un producto, junto con la temperatura de cada semana. Si divido los datos, de modo que sólo tengo 8 años de datos de cuánto se vendió y mantengo los 10 años de datos de temperatura, ¿qué algoritmo de ML sería mejor utilizar para predecir los últimos 2 años de cantidad de ventas?

0voto

Al Pacino Puntos 16

Esto parece un típico series temporales problema. Como no has proporcionado muchos detalles sobre tus datos específicos y sobre qué otras variables tienes información, me limitaré a describir un enfoque general.

En primer lugar, debe categorizar sus variables. Tienes datos de temperatura como variable predictora/independiente. Asumiendo que tienes el valor en grados de la temperatura, tu variable es numérica - lo que significa que podrías tratarla como una variable continua. En cambio, podría procesar los datos y convertirlos en una variable categórica ordinal, pero para ello tendría que seleccionar un umbral de temperatura $T_{0}$ y declarar temperaturas inferiores a $T_{0}$ ser "frío" y temperatura superior a $T_{0}$ estar "caliente". Por supuesto, también se podría dividir la escala de temperatura en más de una categoría si se pensara que una categorización binaria pierde demasiada información de valor. Y, por supuesto, su decisión sobre qué valor utilizar como $T_{0}$ influirá en el valor predictivo de esta transformación.

Ahora, ¿para qué otras variables tienes datos? Teniendo en cuenta las demás variables, debe intentar distinguir entre la variabilidad estacional y el cambio a corto plazo. Por ejemplo, ¿es realmente la temperatura la que afecta a las ventas, o son determinadas estaciones del año las que provocan el cambio en las ventas? Si se producen unos días anómalamente cálidos en pleno invierno, comparables a unos días típicos de primavera o principios de otoño, ¿regresan realmente las ventas al rango de esas estaciones, o no? Creo que el tipo de artículo que se venda puede influir, por lo que la respuesta puede variar, pero también supongo que la variación estacional desempeña un papel más importante que la temperatura diaria.

Asimismo, ¿existe una tendencia a largo plazo, independiente de los cambios estacionales o a corto plazo? ¿Se observa un cambio constante en las ventas de un año a otro? ¿Muestran las ventas de invierno de un año a otro un cambio a largo plazo que vaya más allá de la variación estacional?

Ésta es una forma de tratar las series temporales; existen otros métodos, pero tendría que proporcionar más información o realizar un análisis exploratorio de los datos para determinar qué métodos son los más adecuados. Si no se ha familiarizado antes con las series temporales, la página de Wikipedia es un buen punto de partida: https://en.wikipedia.org/wiki/Time_series

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X