Przyszłość metadanych: otwartość, powiązania i wielojęzyczność – studium przypadku ontologii YSO
,Kategorie: Opracowanie informacji, Technologia informacyjna i bibliotekarska, Biblioteki jako kolekcje
Tagi: Finlandia, Linked Open Data, Sieć Semantyczna, biblioteki narodowe, metadane, ontologie, open source, oprogramowanie o otwartym kodzie źrodłowym, otwarta nauka, systemy organizacji wiedzy, słowniki kontrolowane, tezaurusy, wielojęzyczność, wielojęzyczny dostęp do informacji
Możliwość komentowania Przyszłość metadanych: otwartość, powiązania i wielojęzyczność – studium przypadku ontologii YSO została wyłączona
Celem artykułu było przeanalizowanie procesu tworzenia wielojęzycznego słownika terminologicznego i związanych z tym wyzwań. Przybliżono je na przykładzie doświadczeń zgromadzonych przez pracowników Biblioteki Narodowej Finlandii (BNF) w trakcie budowy fińskiego tezaurusa, serwisu Finto (finto.fi) umożliwiającego publikację i przeglądanie słowników i ontologii oraz ich integrację z innymi aplikacjami, a zwłaszcza podczas rozwoju ogólnej, trójjęzycznej ontologii YSO. Szczególną uwagę poświęcono w tekście problematyce zapewnienia równoważności lingwistycznej terminów i pojęć oraz strategiom translacji wypracowanym w trakcie budowy struktury słowników kontrolowanych i harmonizacji wielojęzycznych metadanych. Skupiono się również na celach prowadzonych prac – systemy te potraktowano nie tylko jako narzędzia indeksowania i wyszukiwania informacji, lecz również jako instrumenty promocji otwartego dostępu do nauki i informacji naukowej, zwłaszcza w dziedzinach takich jak bibliometria czy humanistyka cyfrowa, w których metadane traktuje się jako istotny materiał badawczy. Podkreślono przy tym znaczenie publikacji wielojęzycznych metadanych w modelu Linked Open Data (LOD) oraz potrzebę wypracowania wspólnego rozumienia wykorzystywanych pojęć, jako kroków w kierunku przezwyciężania organizacyjnych i lingwistycznych barier w dostępie do zasobów wiedzy, nie tylko z baz i systemów różnych dostawców lecz również różnych obszarów językowych.
W kraju takim jak Finlandia, funkcjonowanie w trójjęzycznym kontekście nie jest niczym niezwykłym – języki urzędowe to fiński i szwedzki, a w środowisku naukowym powszechne jest używanie języka angielskiego. Zarządzanie informacją w takim środowisku wymaga rozwoju wspólnych praktyk i narzędzi. Odpowiedzią na te potrzeby i wymogi pracy pracy w kontekście Sieci Semantycznej i LOD miał być serwis Finto – wspólne przedsięwzięcie BNF oraz fińskiego Ministerstwa Finansów i Ministerstwa Edukacji i Kultury. System ten bazuje na Skosmos – otwartym, sieciowym narzędziu publikacji i przeglądania słowników SKOS (Simple Knowledge Organization System). Obejmuje słowniki i systemy pojęciowe o charakterze ogólnym oraz dziedzinowym, a także KOKO – zbiór wzajemnie powiązanych fińskich modeli pojęciowych. W ich skład wchodzi fińska ontologia ogólna – YSO, oparta na fińskim tezaurusie YSA i jego szwedzkiej wersji – Allärs, których pojęcia powiązano relacjami równoważności, rozszerzona następnie o angielskie warianty i przyporządkowania w innych językach. Obecnie, YSO zawiera ok. 30 tys. pojęć i jest przeznaczona do użytku w całym sektorze publicznym. Autorzy przedstawili w tekście standardy i wytyczne uwzględnione przy jej rozwoju oraz kryteria przyjęte przy produkcji metadanych, omówili również szczegółowo proces dodawania nowych pojęć do YSO. Zaznaczyli, że choć identyfikatory URI można traktować jako niezależne od języka, w procesie konstrukcji modeli pojęciowych i mapowania ich do innych zasobów pojawia się wiele powiązanych z nim problemów, każde pojęcie należy więc traktować indywidualnie. Praktyczne wyzwania związane z budową pełnej i spójnej hierarchii wielojęzycznego systemu reprezentacji wiedzy podzielono na problemy: 1) lingwistyczne, dotyczące poszukiwań dokładnych i symetrycznych ekwiwalentów konceptualizowanych odmiennie pojęć, 2) kulturowe, będące pochodną odmiennych kontekstów, systemów wartości i praktyk), 3) wynikające z różnic między słownikami. Przedstawiono następnie strategie przyjęte w każdym z tych obszarów i zaznaczono, że wypracowanie dobrych rozwiązań nie jest możliwe bez dobrego rozumienia funkcji słowników, potrzeb ich odbiorców oraz specyfiki poszczególnych języków i występujących między nimi różnic, a ewaluację końcowych efektów należy prowadzić zawsze pod kątem ich użyteczności dla użytkowników, w tym katalogerów, twórców słowników kontrolowanych i osób poszukujących informacji. Podkreślono również społeczne znaczenie otwartej nauki i otwartych narzędzi dostępu przedmiotowego, rozwijanych w wielojęzycznym kontekście.