"Grupo de rocas", "grupo de islas", "el grupo de fábricas", etc. puede ser fácilmente rastreada hasta el siglo 19 (y probablemente mucho más). Por supuesto, las estadísticas temprano comenzó a buscar una manera de formalizar este. Así que buena suerte, usted probablemente tendrá que caminar a una gran cantidad de bibliotecas (la física, no de la biblioteca de software)!
No hay que mirar "aprendizaje automático". ML no inventó el análisis de cluster; y la mayoría de los análisis de cluster de investigación que sucede fuera de la ML de la comunidad.
El término "análisis de cluster" se remonta a la década de 1930 estadística; pero se puede imaginar que "el grupo" en la noción de arriba se utiliza mucho antes -, pero el análisis de cluster intentos de descubrimiento exactamente esta noción de "clusters".
Muchos de los principios de uso fue en la agrupación de las observaciones en la naturaleza, tales como las especies; ya sea por la ubicación o por similitud. No hay equipos involucrados: probablemente no fue hasta 1957 cuando el primero de los algoritmos para el "análisis de cluster" llegó (antes de que, el análisis de cluster fue "lápiz y papel")
P. H. Sneath: La aplicación de los ordenadores a la taxonomía. En:Revista de microbiología general. 17(1), de 1957, S. 201-226.