¿Puede sugerir un buen conjunto de datos internacionales para probar el geocodificador? Lo mejor sería que tuviera direcciones estructuradas y no estructuradas, y coordenadas, pero incluso un número significativo (miles, millones) de direcciones no estructuradas sería un buen comienzo.
Respuestas
¿Demasiados anuncios?Quizás http://openplaques.org . Puede obtener dirección , coordenadas y detalles sobre la limpieza de la geocodificación original de muchas de las placas.
No es una distribución geográfica o lingüística muy homogénea, y además son direcciones ligeramente Impares en general, pero es un conjunto de datos interesante para utilizar.
Pruebe la base de datos Open Addresses. Tiene más de 500 millones de registros. Está disponible para su descarga aquí .
La parte buena es que tiene datos de todas las regiones del mundo. Le sugiero que empiece por América Latina, ya que es uno de los frutos secos más difíciles de descifrar cuando se trata de pruebas de direcciones. A continuación, hazlo con Europa y luego con Asia. Deja los EE.UU. para el final, ya que las direcciones están más estandarizadas allí y para entonces tus casos de prueba deberían cubrirlo bien.