W artykule omówiono projekt budowy i testowania na Uniwersytecie Illinois w Urbana-Champaign narzędzia do geokodowania afiliacji autorów publikacji, mającego usprawnić wyszukiwanie informacji i zapewnić rozróżnialność nazwisk autorów, a także rozszerzyć możliwości prowadzenia skoncentrowanych na autorach, globalnych badań bibliometrycznych obejmujących wymiary geograficznej bliskości i mobilności oraz inne dane, które można powiązać z geograficznymi lokalizacjami. Celem autorów było przydzielenie geokodów na ujednoliconym poziomie szerokiemu spektrum rekordów bibliograficznych z całego świata oraz stworzenie interfejsu wyszukiwawczego geograficznych centrów miast MapAffill, wyświetlający ich współrzędne po identyfikacji miasta.
Bibliograficzne rekordy zawierają często afiliacje autorów w formie ciągów tekstowych w niesformalizowanej postaci. W idealnej sytuacji użytkownik powinien mieć możliwość automatycznej identyfikacji wszystkich afiliacji odnoszących się do danego państwa lub miasta, w praktyce jednak zadanie to wymaga rozwiązania kilku lingwistycznych problemów niejednoznaczności, w tym różnych wariantów pisowni nazw geograficznych. Autorzy opracowali algorytm mający rozwiązać tego typu problemy i umożliwić ekstrakcję odpowiadającego autorowi miasta lub miejscowości oraz jej fizycznej lokalizacji (współrzędne).
Źródło: BABIN 2.0