4 votos

Topónimo de coincidencia de los algoritmos y de los servicios de geocodificación

¿Hay algún topónimo específicos de la coincidencia de los algoritmos, rutinas o servicios disponibles? Por topónimo específico me refiero no sólo a una cadena simple de diferencia de partido, o de soundex/metaphone, pero hay algo que no entiende geográfica abreviaturas y convenciones.

Por ejemplo, coincide con "W. Mt Washington Pkwy" con "West Mount Washington Parkway"; o "Oxon" con "Oxfordshire"; o "en Oxford st" con "Oxford Street"; o "n. s. w." con la "Nueva Gales del Sur"; o "1234 Main St NW" con "1234 Apartamento 345, North West Main Street", o "de San Juan del Ferry" con "San Juan Ferry".

La mayoría de las direcciones que estoy lidiando con (geocodificar, a trazar mapas históricos SIG) están en el nivel ciudad. En la mayoría de los casos hay más elementos de la dirección (país, estado, provincia, país), para evitar demasiados falsos positivos. Tengo datos para el partido contra, el reto es conseguir que los nombres coincidan, permitiendo la variedad de ortografía y las abreviaturas.

Hay varias etapas para que coincida, asumiendo que estamos en el mismo estado/provincia, incluyendo pero no limitado a:

  • simple cadena de partidos, permitiendo diferentes de la palabra de orden
  • ampliar geográfico de las abreviaturas (W, St, Cty, y así sucesivamente), basado en el / los idioma(s) y convenciones del país, realmente sólo un montón de tablas de
  • expanda administración local área de abreviaturas y códigos de la (nueva york, nueva GALES del sur, Oxon, y así sucesivamente)
  • buscar topónimo cambios de idioma y alternativas

Esto es todo lo básico (el de las últimas tres dependen más de los datos de un algoritmo). Aunque algunas partes son difíciles, tales como cuando se expanda Pt Santo, o de la Calle (o intentando).

Así que yo supongo que esta ampliamente necesarios problema ha sido resuelto muchas veces (por gente mucho más experta que yo!), así que no re-inventar la rueda.

Pero, incluso limitando el idioma inglés, de los países (reino unido, Canadá y así sucesivamente, así como la de Estados Unidos), no he sido capaz de encontrar ningún trabajo publicado o software para esto. Me debe estar buscando en los lugares equivocados. ¿Alguien tiene alguna sugerencia para el trabajo existente que se puede construir?

1voto

Örjan Jämte Puntos 3127

ESRI tiene una herramienta ArcMap, llamado Estandarizar las Direcciones que se rompe una dirección en partes (que parece estar basado en algo en URISA normas de direccionamiento). Desde allí, los campos pueden ser concatenados y geocodificada. Si no desea que las abreviaturas, es mucho más fácil hacer una enorme buscar y reemplazar como el nombre, se divide en celdas separadas. Aprendí muy pronto que la sustitución de ave con avenue sobre el total de nombre de la calle le dará molesto resultados como Shaver -> Shavenuer. Mientras que obviamente no ayuda para todos los casos, no cuenta para unos pocos.

No debería ser demasiado difícil de determinar cuando se expanda Pt Saint vs de la Calle. Una áspera forma de hacerlo sería dividir la cadena por espacios en blanco y, a continuación, busque en la lista de subcadenas para las apariciones de el común de los tipos de mensaje (ia,ln,blvd,etc). Si sólo uno de los ST se encuentra, entonces, en general, es la Calle. Si hay un ST encontró con otro tipo de mensaje, entonces por lo general es Santo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X