¿Cuáles son los disponibles libremente conjunto de datos para la clasificación con más de 1000 funciones (o puntos de muestra si contiene curvas)?
Ya hay una wiki de la comunidad acerca de los conjuntos de datos: http://stats.stackexchange.com/questions/7/locating-freely-available-data-samples/
Pero aquí, sería bueno tener una más enfocada lista que puede ser utilizado más convenientemente, también propongo las siguientes reglas:
- Un post por cada conjunto de datos
- No hay enlace a un conjunto de conjunto de datos
-
cada conjunto de datos debe estar asociada con
un nombre (para averiguar de qué se trata) y un enlace a la base de datos (R conjuntos de datos puede ser llamado con el nombre del paquete)
el número de características (vamos a decir que es p) el tamaño del conjunto de datos (digamos que es n) y el número de etiquetas/clase (vamos a decir es k)
un típico de la tasa de error a partir de su experiencia (estado del algoritmo usado en las palabras) o de la literatura (en este último caso el enlace de papel)