* Actualización *
Como menciona un comentario, Keogh y Lin tienen un excelente artículo sobre este tema. En mi opinión, muestran de manera concluyente que aunque la técnica en sí misma se aplica comúnmente como se detalla en mi respuesta a continuación, la utilidad de esta técnica es cuestionada. Lee el artículo por ti mismo, vale mucho la pena: http://www.cs.ucr.edu/~eamonn/meaningless.pdf
* Actualización *
He visto k-means utilizado con éxito en datos de series temporales.
La preocupación general con k-means se debe al número de dimensiones. Más específicamente, cuando estructuras un problema de series temporales para el algoritmo k-means, generalmente tienes ventanas/pasos de datos dentro de los cuales residen porciones contiguas de la serie temporal. Por lo general, producirás muchas muestras de ventana/paso que pueden ser no superpuestas, o superpuestas, dependiendo de tu caso de uso.
En esta situación, cada paso de tiempo dentro del paso se considera una dimensión por el algoritmo k-means. En tal situación, si el número de pasos de tiempo dentro de tu ventana es grande, estás introduciendo mucha dimensionalidad: cada paso de tiempo se convierte en una dimensión. En este caso es cuando k-means suele tener problemas.
Ejemplo
Si tienes una serie temporal cruda compuesta por n pasos de tiempo, tu objetivo puede ser establecer si algún período arbitrario de tiempo dentro de esta serie temporal es similar a un período anterior.
La preparación puede incluir la creación de una ventana móvil de longitud/paso m pasos de tiempo:
ts = [1,2,3,4,1,2,9,8,3,7,9,8,1,7,9,8,1,7,2,9,3,8,7,1,9,8,2,7,3]
ventana1 = [1,2,3]
ventana2 = [2,3,4]
ventana3 = [3,4,1]
ventana4 = [4,1,2]
...
Donde m es 3 en este ejemplo. Ahora tienes un número de muestras creadas a partir de tus datos originales, donde cada muestra tiene una dimensión de 3. La longitud del paso/ventana m y la dimensionalidad son lo mismo. Imagina que cada paso de tiempo dentro de la ventana es una variable independiente diferente de tu experimento. Usando el algoritmo k-means como de costumbre, ahora podrías producir grupos que son prototípicos de tu serie temporal subyacente.
Puedes leer más sobre este tema aquí: Cómo entender las desventajas de K-means
Además, es un problema conocido que entender cuando dos series temporales están 'cerca' en el espacio euclidiano puede ser engañoso. Un buen artículo sobre este tema con código está disponible aquí: http://alexminnaar.com/time-series-classification-and-clustering-with-python.html. En resumen, encontrar una medida de similitud puede ser desafiante, y el Alineamiento Temporal Dinámico es una opción para ayudar a abordar esto.
0 votos
Totalmente no se puede usar K-means. Es mejor usar otra herramienta estadística.
1 votos
¿Puedes enlazar a algunas de las respuestas a las que te refieres? Además: ¿cómo quieres aplicar k-means (u otro algoritmo de agrupamiento) a una única serie temporal? ¿Qué deseas agrupar?
0 votos
¿Es este tu ejemplo real? Claramente, los ejemplos pueden ser hipotéticos, pero no ayuda si parecen totalmente improbables. Me resulta difícil imaginar cualquier motivo posible para agrupar una serie temporal de esta manera. Por otro lado, decir por qué es de interés o utilidad puede ayudar a orientar respuestas.