Los archivos de datos de http://www.csie.ntu.edu.tw/~cjlin/libsvm/ en svm' formato. Estoy tratando de leer esto en la matriz dispersa representación en R. hay un fácil/eficiente manera de hacer esto?
Aquí es lo que estoy haciendo ahora: leer en el archivo línea por línea (de 800.000 líneas), para cada línea por separado clases, valores, y cols. La tienda de las clases como una lista y las características como un .la rse matriz dispersa (1 fila), entonces rbind la función fila con todas las filas anteriores.
Esto es terriblemente ineficiente y, básicamente, no la meta (12 minutos por 1000 líneas). Yo creo que se trata de rbinding las matrices una vez que el número de filas comienza a ser grandes.
Nota: la matriz (800000*48000) es demasiado grande para construir y, a continuación, convertir a formato disperso.
Gracias!