4 votos

Usar diccionarios geográficos para extraer ubicaciones del texto

Estoy empezando a trabajar con los Nomenclátores y tratando de encontrar algo que realmente "mina" geoespaciales ubicaciones de los juegos de texto. Académicamente, esta es una tarea difícil puesto que los textos son basados en el contexto, y como tal, cosas como EL PUENTE, sería muy difícil de identificar. El es el Puente Golden Gate, FYI(Ver cómo mi segunda frase le permite saber dónde estoy).

El resultado final de que estoy buscando es la capacidad de alimentarse de texto en una herramienta y ubicaciones de salida con XY. (Potencialmente con un cierto nivel de "confianza", que sería pedir mucho).

Estoy tratando de construir una herramienta para alimentar en twitter y producir geoespacial salidas(Para visualizar las opiniones políticas con fines académicos).

Tengo algo de experiencia con Python. Sé que esta es una pregunta bastante compleja buscando una respuesta muy simple.Pero cualquier empuja en la dirección correcta sería muy útil. Y aunque esto parece un texto de minería de datos minería de datos y la pregunta, yo creo que es también un SIG pregunta, ya que está rodeada por el concepto de contexto, la idea de asignar algunos absoluta espacio relacional, cosa que, así como hay una cuestión de precisión espacial y precisión relacionado con la idea de asignar coordenadas absolutas a las cosas.

4voto

Adam Ernst Puntos 6939

El proceso que se está intentando es llamado de Recuperación de Información Geográfica (GIR), hay toda conferencias académicas sobre ella. Cuando he trabajado en esto (~10 años atrás) he recogido algunos libros que pueden ayudarle a empezar, por ejemplo, los papeles me etiqueten de la GIR. Una vez que se han extraído los nombres de lugares (topónimos) que usted necesita para reconocer el lugar, y por último de geocodificación.

La desambiguación es el proceso de decidir cuál de los 1000 (o lo) posible Londons su texto se refiere a, la geocodificación es el de convertir el nombre en una ubicación real.

Me gustaría empezar con Jochen L. Leidner tesis del Topónimo de la Resolución en el Texto: Anotación, Evaluación y Aplicaciones Espaciales de puesta a Tierra de los Nombres de Lugar que proporciona una buena introducción a los problemas.

Como para el código me gustaría ver en la geografía paquete que debe ser lo suficientemente buena para empezar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X