103 votos

Localización de las muestras de los datos libremente disponibles

He estado trabajando en un nuevo método para el análisis y el análisis de conjuntos de datos para identificar y aislar los subgrupos de una población sin previo conocimiento de cualquier subgrupo de características. Mientras que el método funciona bastante bien con artificiales de datos de las muestras (es decir, conjuntos de datos creados específicamente para el propósito de identificación y segregación de los subconjuntos de la población), me gustaría probar con datos en vivo.

Lo que estoy buscando es de libre disposición (es decir, no confidencial, no de propiedad) fuente de datos. Preferiblemente uno que contiene bimodal o multimodal distribuciones o de ser obviamente compone de varios subconjuntos que no pueden ser fácilmente separados a través de los medios tradicionales. Dónde voy a ir yo a encontrar la información?

49voto

43voto

Pat Puntos 3464

Ver también el repositorio de datos de aprendizaje de máquina UCI.

http://Archive.ICS.uci.edu/ml/

24voto

Jon Galloway Puntos 28243

Ver mi respuesta a "Conjuntos de datos para el análisis estadístico de funcionamiento en" en referencia a conjuntos de datos en R.

19voto

maclema Puntos 5959

El Banco mundial ofrece un buen montón de datos interesantes y recientemente ha sido muy activa en el desarrollo de niza de la API .

También, commugrate proyecto tiene una interesante lista de disponibles.

Para Estados Unidos la salud relacionados con los datos de la cabeza de los Indicadores de Salud de Almacén.

Daniel Lemire el blog de puntos a algunos ejemplos interesantes (sobre todo a medida hacia DB de investigación), incluyendo Canadá Censo de 1880 y sinópticos en la nube informes.

Y como para el día de hoy (03/04/2012) NOS censo de 1940 registros también están disponibles para descargar.

10voto

user957 Puntos 781

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X