2 votos

Método de aprendizaje automático supervisado para prever la demanda de energía en función de múltiples variables

Necesito el mejor método/algoritmo/técnica de aprendizaje automático para predecir el consumo de energía. El conjunto de datos de entrenamiento consiste en 2 años de consumo de energía, con entradas cada 15 minutos. Además, se proporcionan datos meteorológicos (radiación, humedad, temperatura y velocidad del viento) cada hora.

Ahora como entrada, tengo algunas entradas con exactamente el mismo formato que el conjunto de datos de entrenamiento, excepto, que el consumo de energía tiene que ser predicho con la mayor precisión posible.

El conjunto de datos contiene diversas variables: hora, día de la semana, semana del año, radiación, humedad, temperatura, velocidad del viento y demanda de energía.

El objetivo es que nos den las mismas variables pero para predecir la demanda de energía

El algoritmo debe ser:

  • aprendizaje automático supervisado
  • interpolar el tiempo (radiación, humedad, temperatura y velocidad del viento) antes del entrenamiento porque sólo se dan por hora mientras que nosotros los necesitamos por 15 minutos
  • dividir los datos históricos en dos conjuntos, uno de entrenamiento (a partir del cual la aplicación puede aprender) y otro de prueba, sobre el que comprobar la precisión de las previsiones.
  • esperan que no sólo el tiempo, sino también la hora del día, el día de la semana y la semana del año desempeñen un papel importante en la previsión
  • no se espera que todas las variables desempeñen el mismo papel, incluir todas las posibles variables de entrada puede incluso reducir el rendimiento

P.D. Mis disculpas, chicos, no tengo ninguna experiencia en el aprendizaje automático, sólo necesito un método de aprendizaje automático / biblioteca de programación para predecir el consumo de energía más precisa, gracias.

2voto

Gumeo Puntos 1671

Puede que le interese empezar haciendo un análisis exploratorio antes de lanzarse a crear un modelo de predicción o introducirlo en un marco de modelización de predicciones.

Trata de representar gráficamente los datos para ver si detectas si aparecen algunas tendencias. Es probable que algunas de las variables explicativas que tienes sean completamente redundantes. Dependiendo de la cantidad de datos de que disponga, esto puede hacer que su modelo de predicción se ajuste en exceso si no las ignora.

Lo más probable es que el consumo de energía dependa de las condiciones meteorológicas en cuanto a temperatura y humedad (aunque el viento también influye). Por ejemplo, la gente enciende los radiadores cuando hace frío y el aire acondicionado cuando hace calor. La hora del día también es importante, ya que cuando la gente no está en casa durante el día, puede que no consuma tanta energía en sus hogares, etc.

En lugar de utilizar la hora del día como variable, puede dividirla en menos factores, por ejemplo, noche, mañana, día laborable, tarde. Esto ayudará a evitar el sobreajuste.

También es posible que quieras introducir variables factoriales que indiquen si un día determinado es festivo o no, es decir, que en Navidad o durante la Super Bowl el consumo de energía se dispare. Lo más difícil es modelizar estos grandes picos o valores atípicos en los datos, por lo que tendrás que introducir en la ecuación tu conocimiento experto del problema para tenerlo en cuenta.

No es un problema fácil y, por lo general, el método que se utilice no es lo más importante. Lo más importante es cómo preprocesas los datos y cómo añades tus propias hipótesis sobre las situaciones (por ejemplo, las vacaciones).

Lo más sencillo es utilizar un modelo lineal o un bosque aleatorio. Los bosques aleatorios son fáciles de usar en la mayoría de los idiomas y son bastante seguros para no sobreajustar.

También puede obtener algo del bosque aleatorio que se llama importancia de la variable, le muestra lo "importantes" que son las variables para hacer predicciones y puede ayudar a interpretar los resultados.

Espero que esto te ayude, pero no te pongas a pensar en un modelo de cabeza, piensa en el problema y en lo que importa para estas predicciones. Fíjate también en los residuos después de ajustar el modelo.

0voto

davebowker Puntos 1385

Puede probar con Regresión lineal, SVM o MLP. Son buenos para la previsión de energía.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X