He estado trabajando en un nuevo método para el análisis y el análisis de conjuntos de datos para identificar y aislar los subgrupos de una población sin previo conocimiento de cualquier subgrupo de características. Mientras que el método funciona bastante bien con artificiales de datos de las muestras (es decir, conjuntos de datos creados específicamente para el propósito de identificación y segregación de los subconjuntos de la población), me gustaría probar con datos en vivo.
Lo que estoy buscando es de libre disposición (es decir, no confidencial, no de propiedad) fuente de datos. Preferiblemente uno que contiene bimodal o multimodal distribuciones o de ser obviamente compone de varios subconjuntos que no pueden ser fácilmente separados a través de los medios tradicionales. Dónde voy a ir yo a encontrar la información?