¿Hay algún topónimo específicos de la coincidencia de los algoritmos, rutinas o servicios disponibles? Por topónimo específico me refiero no sólo a una cadena simple de diferencia de partido, o de soundex/metaphone, pero hay algo que no entiende geográfica abreviaturas y convenciones.
Por ejemplo, coincide con "W. Mt Washington Pkwy" con "West Mount Washington Parkway"; o "Oxon" con "Oxfordshire"; o "en Oxford st" con "Oxford Street"; o "n. s. w." con la "Nueva Gales del Sur"; o "1234 Main St NW" con "1234 Apartamento 345, North West Main Street", o "de San Juan del Ferry" con "San Juan Ferry".
La mayoría de las direcciones que estoy lidiando con (geocodificar, a trazar mapas históricos SIG) están en el nivel ciudad. En la mayoría de los casos hay más elementos de la dirección (país, estado, provincia, país), para evitar demasiados falsos positivos. Tengo datos para el partido contra, el reto es conseguir que los nombres coincidan, permitiendo la variedad de ortografía y las abreviaturas.
Hay varias etapas para que coincida, asumiendo que estamos en el mismo estado/provincia, incluyendo pero no limitado a:
- simple cadena de partidos, permitiendo diferentes de la palabra de orden
- ampliar geográfico de las abreviaturas (W, St, Cty, y así sucesivamente), basado en el / los idioma(s) y convenciones del país, realmente sólo un montón de tablas de
- expanda administración local área de abreviaturas y códigos de la (nueva york, nueva GALES del sur, Oxon, y así sucesivamente)
- buscar topónimo cambios de idioma y alternativas
Esto es todo lo básico (el de las últimas tres dependen más de los datos de un algoritmo). Aunque algunas partes son difíciles, tales como cuando se expanda Pt Santo, o de la Calle (o intentando).
Así que yo supongo que esta ampliamente necesarios problema ha sido resuelto muchas veces (por gente mucho más experta que yo!), así que no re-inventar la rueda.
Pero, incluso limitando el idioma inglés, de los países (reino unido, Canadá y así sucesivamente, así como la de Estados Unidos), no he sido capaz de encontrar ningún trabajo publicado o software para esto. Me debe estar buscando en los lugares equivocados. ¿Alguien tiene alguna sugerencia para el trabajo existente que se puede construir?