Tengo una aplicación web que asigna automáticamente los últimos tweets y permite la búsqueda para determinadas palabras clave. utiliza Postgres para la base de datos, geoserver como el servidor, y openlayers como el cartográfica de la biblioteca. Ahora mismo tweet palabras clave se realiza mediante el ILIKE consulta.
Esto funciona muy bien si la palabra que estoy buscando es una palabra comúnmente usada, como 'amor' , 'amigo', 'OMG', etc. pero menos palabras comunes como "geoespacial" la necesidad de buscar a través de muchos más datos con el fin de encontrar el último n de las instancias de la palabra. Este es muerta.
Para combatir mi lentitud estoy construyendo un GIN índice en mi tweet de campo en postgres. Dos días más tarde y todavía estoy esperando que el índice completo. Una vez construido sin embargo, voy a probar un par de consultas con SQL parámetros de vista y espero que esto se drásticamente la velocidad de las cosas.
Incluso si este enfoque funciona, sin embargo, no va a ser del todo útil si el índice toma tanto tiempo para crear -- el mantenimiento de la misma no será capaz de mantenerse al día en los entrantes de la inundación de datos. Creo que voy a probar la Esencia de índice siguiente y ver cuánto tiempo se tarda como entiendo que es mucho más rápido para construir este índice.
Más allá de esto, ¿qué puedo hacer? Hacer opciones como Solr trabajo con Geoserver?? Hay enfoques comunes para este tipo de problema y el tamaño de los datos/de la tasa?