Donde puedo encontrar los conjuntos de datos útiles para la prueba de mi propia Máquina de Aprendizaje de las implementaciones?

Question

Donde puedo encontrar los conjuntos de datos útiles para la prueba de mi propia Máquina de Aprendizaje de las implementaciones?

Preguntado el 1 de Agosto, 2012: Cuando se hizo la pregunta
3439 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Actualmente estoy tratando de implementar algunos algoritmos de Aprendizaje automático en el mío propio. Muchos de ellos tienen la desagradable propiedad de ser difíciles de depurar, algunos errores no causan el programa de choque, sino que el trabajo no como la intención y parecen como de los algoritmos, sólo da más débiles resultados.

Me gustaría tener alguna manera de aumentar mi confianza en la aplicación, por ejemplo si he tenido algunos pequeños conjuntos de datos, con información adicional Algoritmos de "X trabajado para Y las iteraciones y resultados Z en este conjunto de datos", que sería realmente útil. Alguien ha oído hablar de este tipo de datos?

Preguntado el 1 de Agosto, 2012 por Craig Trader

Answer 1

2 Respuestas

Answer 2

10voto

Sinestro Puntos 1

A partir de la UC Irvine de la Máquina de Aprendizaje Repositorio:

Actualmente mantenemos 223 conjuntos de datos como un servicio a la máquina de la comunidad de aprendizaje. Usted puede ver todos los conjuntos de datos a través de nuestra interfaz de búsqueda. Nuestro antiguo sitio web está disponible todavía, para los que prefieren el formato antiguo. ... Si usted desea donar un conjunto de datos, por favor consulte nuestra política donación. ... También hemos creado un sitio espejo para el Repositorio.

También, los siguientes MIAS conjunto de datos ha sido ampliamente utilizado y estudiado:

Cuando la evaluación comparativa de un algoritmo es recomendable el uso de un estándar de prueba de la base de datos (conjunto de datos) para que los investigadores sean capaces de comparar directamente los resultados. La mayoría de la mamografía de bases de datos no están disponibles públicamente. El más fácil de acceder a bases de datos y por lo tanto el más comúnmente utilizado bases de datos de la Imagen Mamográfica Análisis de la Sociedad (MIA) de la base de datos y la Base de datos Digital de la Mamografía de Detección (DDSM). Además, en la actualidad hay pocos proyectos de desarrollo de la nueva imagen mamográfica bases de datos, así como varios proyectos antiguos.

Respondido el 1 de Agosto, 2012 por Sinestro (1 Puntos )

Answer 3

5voto

AlberT Puntos 6591

La UCI repositorio mencionado por Bashar es probablemente el más grande, sin embargo, yo quería añadir un par de pequeñas colecciones que me encontré:

Los conjuntos de datos de la Mulan biblioteca de Java
Los conjuntos de datos de la Auton laboratorio de la Universidad Carnegie Mellon de la Escuela de Ciencias de la computación
Los conjuntos de datos utilizados en el Libro Elementos de Aprendizaje Estadístico
Varios conjuntos de datos de KDD competiciones de la Copa
Los conjuntos de datos en el Departamento de Estadísticade la Universidad de Munich

Respondido el 2 de Agosto, 2012 por AlberT (6591 Puntos )

Donde puedo encontrar los conjuntos de datos útiles para la prueba de mi propia Máquina de Aprendizaje de las implementaciones?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Donde puedo encontrar los conjuntos de datos útiles para la prueba de mi propia Máquina de Aprendizaje de las implementaciones?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: