Quiero crear un archivo del correo que recibo y envío. Parte de mi objetivo es proporcionar estadísticas públicas sobre este archivo, como un mapamundi con una chincheta para cada lugar al que envié o del que recibí correo. Para proteger la identidad de las personas de las que recibo y a las que envío correo, me gustaría anonimizar las direcciones. Es decir, en lugar de señalar la dirección exacta a la que llegó el correo, la chincheta debería colocarse sobre la región general en la que se encuentra la dirección. Esta región debería seguir las divisiones administrativas para que la gente tenga una idea de a dónde llegó el correo.
La palabra "región" es intencionadamente difusa, ya que no estoy seguro de qué deberían ser estas regiones. Equiparar regiones a países es tosco para las estadísticas que me gustaría proporcionar. Pensé en utilizar los códigos ISO 3166-2 para las regiones, que tienen la ventaja de una representación textual estandarizada y corta, pero aún no he encontrado un conjunto de datos que resuelva los códigos ISO 3166-2 en coordenadas.
Por ejemplo, cuando envío un correo a Bundestag alemán, Platz der Republik 1, 11011 Berlín, Alemania una dirección anonimizada podría tener este aspecto, de fino a grueso:
- 11011 Berlín, Alemania
- Mitte, Berlín, Alemania
- Berlín, Alemania / DE-BE
- Alemania
¿Existe un conjunto gratuito de puntos de datos que pueda utilizar para estas direcciones anonimizadas? El conjunto de datos debería contener para cada región
- El nombre inglés o local de la región
- Un par de coordenadas en el centro de la región
- opcionalmente, una representación textual breve y única de la región
Debería ser obvio para un tercero a qué región se refiere cuando se le proporciona el nombre.