¿Cuáles son los más memoria eficiente de los paquetes de código abierto para el cálculo de una regresión ponderada geográficamente (GWR)?
Yo estoy en una situación en la que necesito para hacer una regresión ponderada geográficamente en un conjunto de puntos en los que los datos de entrenamiento se compone de alrededor de 40.000 observaciones y cada observación tiene cerca de 20.000 variables.
He implementado una versión de GWR a mí mismo usando una combinación de Python Numpy/SciPy y PostGIS. Voy a resolver la regresión utilizando un enfoque de álgebra de matrices, pero esta falla debido a problemas de memoria cuando tengo densos, ricos de la característica de los sistemas con muchas de las observaciones.
Una forma de sortear el problema de la memoria es el uso de un enfoque iterativo para encontrar una línea de mejor ajuste, tales como un incremento en el gradiente de la pendiente. Estoy pensando que debería funcionar algo como (http://www.eecs.wsu.edu/~cook/dm/lectures/l5/node14.html). Incremental de Gradiente de la pendiente se describe bastante bien aquí, en las páginas 4 a 7 (http://cs229.stanford.edu/notes/cs229-notes1.pdf).
Obviamente, yo podría implementar esto de mí, pero tenía la esperanza de que tal vez alguien más ya había codificado algo similar.