Indexación mediante Arrays de Sufijos para Recuperación de Información Geográfica

Nieves Brisaboa, Miguel Luaces, Gonzalo Navarro, and Diego Seco

La recuperación de información geográfica constituye un área de investigación joven, pero que está captando mucha atención debido al interés de los usuarios de repositorios de información digital en obtener información relevante en el lugar geográfico donde se encuentran o que van a visitar. El objetivo principal de dicha área consisteen recuperar información relevante no sólo en cuanto a su contenido textual sino también en cuanto a su referente geográfico (es decir, al lugar al que se refiere). Para ello una de las tareas fundamentales es la indexación de la información. La mayoría de las propuestas realizadas hasta la fecha combinan un índice invertido con algún índice espacial.

En este artículo presentamos una estructura de indexación que no emplea un índice invertido para indexar el contenido textual, sino que emplea un array de sufijos. Esto permite dotar a los sistemas de recuperación de información geográfica de nueva funcionalidad. Por ejemplo, no excluye lenguajes humanos que no son fácilmente separables en palabras, como el chino o el coreano. Además, constituye una alternativa a la utilización de un índice invertido cuando la búsqueda de frases es frecuente.