3 votos

¿Es apropiado incluir la característica de retraso en el tiempo en el enfoque tradicional (sin series temporales) de ML?

He buscado un poco y no he podido encontrar una respuesta concluyente a esta pregunta. Digamos que tengo varias características que no implican tiempo como: distrito escolar, código postal, edad, nivel de lectura, y estoy tratando de predecir el porcentaje de exámenes que un estudiante pasará durante ventanas de 30 días. Digamos también que sólo tenemos datos para 90 días, por lo que sólo habría dos características retardadas (% de exámenes aprobados en los primeros 30 días, % de exámenes aprobados en los segundos 30 días).

¿Es apropiado utilizar una característica retardada en combinación con esas características estáticas para predecir el porcentaje total de pruebas aprobadas y/o las pruebas aprobadas a los 90 días? Leí un artículo en el que se utilizaba un conjunto de un modelo de series temporales y un modelo estático para hacer predicciones sobre esos datos, pero parece problemático construir un modelo de series temporales si sólo hay dos períodos de tiempo para cada estudiante. También parece que si las características temporales se incluyeran en un modelo tradicional de ML podría haber algunos problemas con la suposición iid? Gracias por su tiempo, estaré encantado de proporcionar cualquier otra información necesaria. No he encontrado nada, incluso después de buscar en la literatura y aquí.

1voto

Vitaly Zdanevich Puntos 95

¿Es apropiado utilizar una característica retardada en combinación con aquellas características estáticas para predecir el porcentaje total de pruebas aprobadas y/o pruebas superadas a los 90 días?

Sí, y es de uso común (al menos en la industria). No todos los problemas de series temporales se resuelven mediante métodos tradicionales de series temporales.

También parece que si las características de tiempo se incluyeron en un tradicional modelo ML tradicional podría haber algunos problemas con la suposición iid?

La hipótesis iid se refiere a la independencia de las distintas muestras. Digamos que se está prediciendo $x_t$ con características $x_{t-1}$ y otros estáticos. Y, dejemos otra muestra de entrenamiento $x_{t-1}$ con características $x_{t-2}$ y las correspondientes estáticas. Seguramente, las muestras de entrenamiento no son iid, pero aun así este tipo de enfoque también se utiliza habitualmente. Un ejemplo típico serían las redes LSTM.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X