3 votos

Crear shapefile de millones de direcciones geocodificadas

Estoy tratando de hacer un mapa de las unidades administrativas de un estado. Tengo una lista de ~10 millones de direcciones con una variable que indica que la unidad a la que pertenezcan. Mi plan es para geocodificar direcciones usando una instancia de Amazon EC2 o similar solución de geocodificación, mapa de los puntos y, a continuación, dibujar polígonos alrededor de los conjuntos de puntos.

Dada mi relativa inexperiencia con GIS, me pregunto si no es la forma más sensata de abordar este problema. Las direcciones son muy limpios, con los códigos postales adjunto (a veces zip+4), y el 99% o más de las direcciones deben ser agrupados juntos correctamente en un único polígono contiguo. Pero puedo anticipar que después de geocodificación algunas direcciones caerá fuera de la lógica de los límites del polígono y deben ser corregidos post hoc. Cada unidad tendrá ~1200 direcciones geocodificadas en promedio, con variaciones significativas. Mi lista de direcciones representa aproximadamente el 40% de todas las direcciones dentro de las unidades, por lo que los puntos que voy a tener que trabajar con bastante densa.

Es esta la única manera de abordar el problema? Nota: soy un estudiante de posgrado, por lo que cualquier solución tiene que ser barato o gratis (mi presupuesto es de menos de $300).

Editado para añadir: Todas las direcciones que están en un único estado de estados unidos. Estoy trabajando en ArcMap 10.4 e incluso averiguar cómo utilizar una API ha sido difícil. Mis direcciones son sólo en una .archivo csv y me eventualmente desean .shp archivo. Yo soy un estadístico, no un profesional de SIG, por desgracia.

1voto

Paul D'Ambra Puntos 101

Usted puede encontrar que es más fácil sacrificar la precisión y utiliza algún tipo de enfoque simple donde usted tiene que dividir el área en una cuadrícula y, a continuación, asignar a cada celda de la cuadrícula a su más comunes de la unidad administrativa? Luego de la unión misma unidad administrativa las celdas de la cuadrícula después? Como otros han señalado, haciendo polígonos con precisión va a ser difícil.

Usted va a suponer que tenga problemas con las células de la red que necesitan ser menor en las ciudades que en las zonas rurales (es decir, las unidades cubren pequeñas áreas geográficas en las ciudades). Usted puede evitar esto mediante el uso de un espacio quadtree de algún tipo - es decir, comenzar con un solo quadtree nodo que cubre toda el área y, a continuación, de forma recursiva dividir de tal manera que ningún nodo contiene más de 100 direcciones o similar. Te gustaría terminar con una más refinada de la cuadrícula en las ciudades.

Estoy adivinando que había necesidad de utilizar R o algún lenguaje de programación para hacer esto en lugar de ArcMap...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X