Supongamos que tengo un conjunto de datos de acelerómetro recogidos con un sensor y una etiqueta para cada punto de datos medido. Estas etiquetas describen diferentes estados de mi sistema Por ejemplo, $state_A, state_B, state_C$ etc.., y quiero utilizar esta información para entrenar un clasificador que reconozca estos estados mencionados anteriormente.
Ahora, digamos que quiero utilizar una ventana deslizante fija para extraer algunas características en lugar de alimentar los datos brutos al clasificador. El tema es que algunas de estas ventanas deslizantes podrían contener más de una etiqueta única: Por ejemplo la ventana de tiempo contiene la transición de $state_A$ a $state_C$ . ¿Qué debo hacer con este tipo de ventanas? ¿Debo descartarlas? ¿Debo establecer un umbral para determinar si los utilizo o no ( Por ejemplo si el 90% o más de los puntos medidos coinciden con la misma etiqueta, entonces es correcto utilizar la ventana)? ¿Existe alguna práctica recomendada para manejar este tipo de situaciones?
En la siguiente figura añado un ejemplo de esta cuestión: la imagen muestra un gráfico de tres estados diferentes que podría tener el sistema, y están codificados como 1,2 y 3 para su visualización. Digamos que quiero tomar ventanas de cada 25 muestras sin que se solapen, por lo que las líneas verticales rojas muestran el principio y el final de cada ventana temporal.
Hay ventanas que sólo poseen un único estado, pero otras contienen más de uno.