2 votos

Predicción de latitud y longitud a partir de características binarias

Tengo una serie de observaciones que ocurren alrededor de mi ciudad (un área pequeña), y varias de ellas tienen latitud y longitud. He estado buscando en la predicción de la latitud / longitud de las observaciones que no están etiquetados geográficamente, pero no estoy seguro de que el mejor enfoque.

Un enfoque que he visto divide un área en secciones más pequeñas y predice la probabilidad de que un punto caiga en una sección específica.

Wing y Baldridge, 2011: https://scholar.google.com/scholar?cluster=7781354766705840422&hl=en&as_sdt=0,11

Han, Cook y Baldwin, 2014: https://www.jair.org/papers/paper4200.html

¿Conocéis alguna alternativa para solucionar este problema? Parece que estimar la latitud y la longitud por separado sería un error, ya que están relacionadas. El enfoque de la cuadrícula lo solucionaría, pero podría faltarle precisión.

1voto

ewok Puntos 133

Acabo de encontrar un documento que podría ser al menos algo relevante para su pregunta. No utiliza características binarias; utiliza características de texto en su lugar, pero probablemente podría modificar su enfoque para acomodar sus entradas.

El papel es Estimación de la ubicación del usuario en las redes sociales con autocodificadores de eliminación de ruido apilados . Se trata de un enfoque de aprendizaje profundo que utiliza el texto de los tweets para crear un modelo que estima la región dentro de los Estados Unidos y también el estado, y luego otro modelo que estima la latitud y la longitud. El único defecto que veo en su enfoque es que no parecen tratar la tierra como una esfera o un esferoide oblato. Si tu ciudad está dividida por la línea internacional de la fecha, esto puede ser un problema grave, pero si no es así, puedes ignorarlo y seguir obteniendo una precisión decente.

1voto

ewok Puntos 133

Tengo otro enfoque que puede ser útil. En este documento el autor intenta predecir una latitud y una longitud a partir de una cadena de texto. Para ello, divide la cadena de texto en "n-gramas" individuales (básicamente, palabras) y crea un modelo de mezcla gaussiana (GMM) para cada n-grama. Para predecir una lat/lon para una nueva cadena de texto que nunca se ha visto antes, se pueden encontrar todos los n-gramas en la nueva cadena de texto, y combinar los GMM para cada uno de esos n-gramas en un nuevo GMM. Este nuevo MMG es un mapa de las localizaciones más probables del origen de esa cadena de texto. En el mejor de los casos, se puede elegir un punto obvio de alta prioridad como la ubicación más probable para el origen de la cadena de texto.

Del mismo modo, se pueden crear MMG para cada una de las características binarias disponibles. Cada vez que una de las características binarias sea verdadera, sólo hay que tratarla como si fuera uno de los n-gramas que se han encontrado en una cadena de texto. Si tiene muchas características binarias, probablemente podrá obtener resultados decentes sin mucho trabajo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X