20 votos

Buenos recursos sobre algoritmos de geocodificación

¿Conoces algún buen recurso sobre algoritmos de geocodificación?

Estoy particularmente interesado en el análisis de consultas de direcciones, incluida la coincidencia y ponderación de partes de la consulta, la gestión de errores de ortografía y variaciones, así como en detalles sobre el almacenamiento de datos físicos (por ejemplo, esquemas para consultas directas a bases de datos relacionales, enfoques para indexación de datos, etc.).

He estudiado algunos documentos sobre geocodificación ArcGIS 10, pero apenas tocan los detalles de implementación real. La documentación detallada de otras implementaciones de producción de alta calidad también podría ser útil. Cuanto más técnico, mejor. Los documentos teóricos de algoritmos también son excelentes.

14voto

Erik Öjebo Puntos 6937

De Texto a Coordenadas Geográficas: El Estado Actual de la Geocodificación

Daniel W. Goldberg, John P. Wilson y Craig A. Knoblock Resumen: Este artículo presenta una encuesta del estado del arte en prácticas de geocodificación a través de una revisión histórica interdisciplinaria de la literatura existente. Exploramos el concepto en evolución de la geocodificación y los componentes fundamentales del proceso. También se discuten fuentes de error y de incertidumbre frecuentemente encontradas, así como medidas existentes utilizadas para cuantificarlas. Se presenta un examen de trampas comunes y desafíos persistentes en el proceso de geocodificación, y se describen los métodos tradicionales para superarlos.

10.1.1.119.714.pdf

PDF (página 34 en adelante) http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.119.714&rep=rep1&type=pdf

6voto

Adam Tuttle Puntos 7982

El artículo al que Mapperz enlazó es muy bueno y tiene muchas citas que probablemente serán de interés, pero no creo que hagan un buen trabajo describiendo la coincidencia de cadenas y su importancia en el proceso de geocodificación. Mencionaron brevemente Soundex, pero Soundex no es la única opción y ni siquiera la mejor opción para direcciones en mi opinión. Enumeraron bastantes citas pertinentes al tema, así que esos documentos serán de interés para ti.

Este hilo en el sitio de intercambio de estadísticas habla sobre la coincidencia difusa de dos conjuntos de cadenas, y todas las mismas técnicas se aplican al coincidir direcciones. Particularmente creo que usar distancias de edición tiene más sentido que Soundex, especialmente con detalles de direcciones que no tienen un análogo en Soundex. Calcular la distancia de Levenshtein entre dos cadenas no es tan complicado, y hay muchos ejemplos por internet (aquí hay uno en Python).

Acabo de pasar la última hora tratando de encontrar cómo implementa ESRI su sensibilidad a la ortografía y sus diferentes puntajes de candidatos y coincidencias. No he encontrado más que descripciones simples (la mejor de las que encontré está en este PDF y en la sección de ayuda en línea del 9.3 de ESRI aquí). Así que si alguien puede indicarme alguna documentación más detallada, estaré agradecido al igual que el autor original.

3voto

Adam Puntos 343

La Universidad de Carolina del Sur tiene servicios de procesamiento de direcciones y geocodificación para los cuales han publicado algunos detalles técnicos. Tienen muchas referencias útiles en su sitio.

3voto

jay Puntos 476

La lista de correos de GEOREFERENCIA proporcionada por UK JISC https://www.jiscmail.ac.uk/cgi-bin/webadmin?A0=GEOREFERENCING

Mi blog (sección de geocodificación) contiene de vez en cuando publicaciones sobre geocodificación y resolución toponímica (su equivalente no estructurado): http://bit.ly/lQ0Sjs

2voto

jdecuyper Puntos 2690

Un buen recurso para estudiar la geocodificación https://webgis.usc.edu/Services/Geocode/About/TechnicalDetails.aspx

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X