Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Budowa platformy dla tezaurusa w postaci Linked Open Data

Autor: Małgorzata Waleszko,

Kategorie: Źródła informacji, Opracowanie informacji

Tagi: , , , , , ,

Możliwość komentowania Budowa platformy dla tezaurusa w postaci Linked Open Data została wyłączona

Systemy organizacji wiedzy (KOS), w tym zwłaszcza tezaurusy, pełnią istotną rolę w zarządzaniu informacją i optymalizacji jej wyszukiwania, a ich znaczenie wzrasta wraz z postępami w rozwoju Sieci Semantycznej i Linked Data, brak uniwersalnego programistycznego interfejsu i standardów opisu utrudnia jednak wykorzystanie KOS w środowisku sieciowym i zapewnienie ich semantycznej współoperatywności. W artykule przedstawiono podstawowe wyznaczniki koncepcji tezaurusów w postaci Linked Open Data (LOD) jako dynamicznego systemu informacyjnego, a nie statycznego źródła danych, a następnie przeanalizowano problem opisu, publikacji, linkowania i użytkowania tezaurusów jako zbioru zasobów terminologicznych, proponując nowe, systematyczne podejście do udostępnia tych słowników jako LOD.

W badaniu przyjęto za punkt wyjścia 4 zasady Linked Data (stosowanie URI jako nazw obiektów, protokołu HTTP URI do wyszukiwania danych o tych obiektach, zapewnianie użytecznych informacji o obiektach (RDF) po aktywacji URI i linkowania URI w celu zapewnienia możliwości eksploracji innych obiektów), uwzględniono też jedynie format reprezentacji wiedzy SKOS (Simple Knowledge Organization System), a jako przykład stosowanego podejścia, mającego na celu włączenie do tezaurusa serwisów terminologicznych i zapewnienia bardziej opisowych informacji na jego temat (nie tylko jako całości, ale też elementów z niższych poziomów), wykorzystano stronę dwujęzycznego słownika Government of CANADA Core Subject Thesaurus (GCCST). Aby zaprezentować możliwości nowej platformy publikowania tezaurusa jako LOD, stworzono demonstracyjny system w procesie proof-of concept, zapewniający 3 typy interfejsów (HTML, Linked DATA i SPARQL) oraz opisy WADL mające ułatwić wykorzystanie tezaurusa, i omówiono w tekście szczegółowo jego projekt, architekturę, funkcjonalność i ograniczenia. Przedyskutowano też różnice między dotychczasowymi próbami budowy Linked Open Thesaurus, a modelem przedstawionym przez autora, podkreślając potrzebę przeprowadzenia dalszych badań niezbędnych do jego testowania i walidacji.

We wnioskach stwierdzono, że publikacja tezaurusa jako LOD nie jest tak prosta jak umieszczenie w sieci pliku RDF sformatowanego jako SKOS, i wymaga większego wysiłku, w tym różnych poziomów opisu, dobrze zaprojektowanych identyfikatorów URI i serwisów terminologicznych. Słownik w tej postaci powinien być łatwo wyszukiwany i prosty w użyciu, jako że celem publikacji tezaurusów jest ich udostępnienie do wykorzystania szerokiej publiczności. Wg autora, proponowane podejście nie stoi w sprzeczności z tradycyjnymi podejściami do tego zagadnienia, lecz je uzupełnia, model ten można też dostosować do wykorzystania w bazujących na FRBR profilach aplikacji dla KOS.

Komentarze wyłączone.