OSMNames: Datos de topónimos y geocodificador
Publicado el 05 de octubre de 2016

Hoy lanzamos el proyecto de código abierto OSMNames que proporciona una funcionalidad básica de búsqueda de lugares / geocodificación.
Se trata de un sistema de búsqueda ligero con un motor de texto completo con cobertura mundial. Por el momento se limita a nombres de lugares como calles, pueblos, ciudades, unidades administrativas, países, etc. En el futuro podrá ampliarse con otros tipos de lugares, como nombres de lagos o montañas, e incluso con PDI. También es posible la ampliación con direcciones postales (números de casa y códigos postales). Pruébalo en:
http://osmnames.org/ Instale fácilmente el software junto con los datos globales proporcionados en su propio servidor con el contenedor docker osmnames-sphinxsearch. El proceso se describe en la documentación.
El proyecto OSMNames consta de dos partes:
Datos de OSMNames disponibles para su descarga
El núcleo del proyecto OSMNames son los datos preprocesados. Viene en un formato de texto fácil de manejar, el TSV (tab separated value). Esto permite el filtrado con herramientas de procesamiento de texto UNIX (grep, sed, awk, less, cut, etc.) y la indexación directa a través de un motor de búsqueda de texto completo.
Puede descargar los datos en http://osmnames.org/download/
Contiene más de 21 millones de registros del nomenclátor con localización lat/lon, cuadro delimitador, nombres en varios idiomas, identificadores para OSM y Wikidata, etc. Todos los registros están ordenados por importancia numérica precalculada (derivada de Wikipedia y de la clasificación existente de Nominatim). Nuestro sitio web recomienda filtrar los datos por país, ubicación geográfica o tipo para crear extractos más pequeños.
Software para motores de búsqueda
El proyecto viene con un software de servidor de código abierto que proporciona una API de búsqueda de lugares adecuada para un geocodificador básico con funcionalidad de autocompletado. El servidor está escrito en Python y funciona con el motor de texto completo de código abierto C++ de alto rendimiento llamado Sphinx Search.
El proyecto OSMNames es el resultado de la cooperación entre Klokan Technologies GmbH y HSR Rapperswil.
Klokan Technologies GmbH utiliza el servicio en productos como MapTiler o Georeferencer. Estamos muy contentos de liberarlo ahora y esperamos que más usuarios puedan ayudarnos a hacerlo aún mejor. Esperamos ver OSMNames adoptado por más individuos y empresas pronto.er está escrito en Python y es impulsado por el motor de texto completo de código abierto C++ de alto rendimiento llamado Sphinx Search.