6 votos

¿Geocodificación a través de la barrera lingüística del francés canadiense?

Esto está relacionado con Geocódigos muy imprecisos en Canadá (Quebec) .

Me he dado cuenta de que el archivo de calles que utilizo como localizador de direcciones en Canadá utiliza caracteres franceses (o simplemente acentuados) para los nombres. Estos aparecen de manera similar a los siguientes:

Québec
De la Riviàre-du-Lac
Franúois-de Villars

El producto Dirección, sin embargo, utiliza caracteres ingleses estándar (¿se nota mi americocentrismo?), lo que hace que los ejemplos anteriores se muestren así:

Quebec
De la Riviere-du-Lac
Francois-de Villars

Creo que la geocodificación iría mucho mejor si los nombres de las calles coincidieran realmente a través del mismo juego de caracteres. ¿Cómo me recomiendan que haga la conversión de uno a otro? He considerado la posibilidad de utilizar regex, pero he pensado en preguntar antes de empezar.

P.D. Estaría bien que no recibiera texto basura de caracteres franceses, a pesar de todo. Toda la información se almacena en Geodatabases, por cierto, si eso importa en absoluto. Estoy en Arc10, también.

P.P.S. Parece que puedo mostrar los caracteres acentuados sin problemas, pero en los Shapefiles y GDB Feature Classes, se convierten en texto basura. ¿Hay algún ajuste que me estoy perdiendo aquí? CURIOSO: Parece que en un producto callejero los nombres salen basura, pero en el otro se muestran sin problemas.

7voto

Paul Puntos 555

Eso no es basura, es UTF-8 siendo mostrado como CP1252.

Este tema de Stackoverflow puede ayudarle en su camino, al igual que éste (si estás en Python).

6voto

Adam Puntos 343

Como ha señalado Jason, hay un desajuste entre el conjunto de caracteres de los datos y el conjunto de caracteres del localizador. Probablemente sea la geodb la que no coincide con los datos y viceversa. Asegúrate de que la geodb está en UTF-8.

Si desea conservar los caracteres acentuados y obtener un 100% de coincidencia con las grafías no acentuadas, almacene las versiones no acentuadas de los nombres en una tabla de nombres alternativos y configura tu localizador de direcciones para que también lo busque .

Consulte los enlaces de Jason para conocer los métodos de conversión de los nombres.

NOTA: Una vez corregido el desajuste de codificación de caracteres, pruebe el localizador antes de crear la tabla de nombres alternativos. No estoy seguro de si hará una conversión automática para usted.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X