He estado buscando en el multiprocesamiento y herramientas como Encontrar Duplicados en Big Data y parecen simplemente dividir los datos en secciones basadas en las filas/número de registros. Estoy tratando de hacer un cruzan en conjuntos de datos que van desde 30 a 100 millones de registros ver este link para más detalles sobre el proyecto) y para que los datos (por ejemplo para el aspecto, la pendiente y la vegetación), debe ser dividido en zonas geográficamente el mismo...alguna idea de cómo hacer esto?
Idealmente en arcgis 10.