Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

AUTHORIS: narzędzie kontroli kartotek wzorcowych w Sieci Semantycznej

Autor: Grażyna Jaroszewicz,

Kategorie: Opracowanie informacji, Technologia informacyjna i bibliotekarska, Działalność biblioteki

Tagi: , , , , , , , ,

Możliwość komentowania AUTHORIS: narzędzie kontroli kartotek wzorcowych w Sieci Semantycznej została wyłączona

W artykule omówiono program AUTHORIS opracowany na Wydziale Informacji i Komunikacji Uniwersytetu w Granadzie w Hiszpanii. Jest to narzędzie umożliwiające generowanie haseł wzorcowych dla rekordów bibliograficznych na podstawie zasobów kartotek wzorcowych i zbiorów słownictwa opublikowanych w modelu Linked Data, za pomocą algorytmów uczenia. AUTHORIS opracowano, by rozszerzyć kontrolę autorytatywną i wymianę informacji między ośrodkami bibliograficznymi i innymi instytucjami.

Środowisko bibliotekarskie od dawna miało świadomość potrzeby kontroli autorytatywnej. Autorzy artykułu przedstawili najważniejsze etapy rozwoju metod oraz standardów dotyczących tego procesu, poczynając od projektu Biblioteki Kongresu – Name Authority Cooperative (NACO), a w Azji Hong Kong Chinese Authority Name (HKCAN), przez powstanie ISADN (International Standard Authority Data Number), powołanie w ramach ALA Control Interest Group (ACIG), opracowanie FRBR (Functional Requirements for Bibliographic Record), AACR2 (Anglo-American Cataloguing Rules, Second Edition), czy formatu MARC, a kończąc na ISAN (International Standard Authority Number) oraz ISTC (International Standard Text Code). Przybliżyli także formaty, standardy i modele, które, ich zdaniem, należy uwzględniać podczas tworzenia narzędzi kontroli autorytatywnej w Sieci Semantycznej, a wśród nich m.in. protokół Z39.5, MARC 21, FRBR, EAD (Encoded Archival Description), FRANAR (Functional Requirements of Authority Numbering and Records). Szerzej omówiono RDA (Resource Description and Access) i VIAF (Virtual International Authority File) ze względu na ich znaczenie w opracowaniu programu AUTHORIS. VIAF jako globalny serwis informacyjny łączy rekordy wzorcowe z różnych bibliotek. Zdaniem autorów artykułu istnieją jednak ograniczenia, z powodu których wiele bibliotek nie może się do niego włączyć i spełnić jego wymagań. Po stronie barier wymieniono m.in. używanie niejasnej dla przeciętnego użytkownika sieci terminologii bibliotekarskiej; brak powszechnego stosowania w skali międzynarodowej standardów i przepisów takich jak np. AACR2 lub RDA; ograniczenia kadrowe; tworzenie części zasobów „autorytatywnych” w instytucjach, niebędących bibliotekami czy ośrodkami bibliograficznymi i stosunkowo małą liczbę instytucji uczestniczących w VIAF. W celu wprowadzenia wymogów VIAF i kontroli autorytatywnej w obrębie Sieci Semantycznej lub Linked Data, potrzebny jest nowy wymiar przetwarzania informacji. Rekordy bibliograficzne powinny być zapisane w formatach przyjętych za standardy w Sieci Semantycznej. Zasadnicze znaczenie ma stosowanie RDF. Rozwój standardów Sieci Semantycznej (np. FOAF, SKOS, Dublin Core), ich wzajemne powiązania i łatwość użycia pozwalają każdemu użytkownikowi na  tworzenie kolekcji metadanych niezależnie od  zaawansowania technologicznego. Jednym z najpopularniejszych schematów metadanych w sieci semantycznej jest FOAF (Friend of a Friend), którego specyfikacja opiera się na standardzie RDF.

Program AUTHORIS opracowano w celu ułatwienia przetwarzania danych wzorcowych zgodnie z modelem Linked Data. Łączy on potencjał Linked Data i standardów Sieci Semantycznej, które uzupełniono zasadami, wynikającymi z doświadczeń bibliotekarzy w tworzeniu punktów dostępu. Narzędzie to może być stosowane w różnego rodzaju ośrodkach bibliograficznych, wydawnictwach, organizacjach i bibliotekach. Opiera się na otwartym systemie typu CMS (system zarządzania treścią) – Drupal, obsługującym schematy Dublin Core, SIOC, SKOS, FOAF. Główne funkcje AUTHORIS to: 1) autoryzacja – przypisanie użytkownikowi zadań przez administratora systemu; 2) wyszukiwanie informacji – wszyscy użytkownicy, także ci nieuwierzytelnieni, mogą wyszukiwać informacje mając do dyspozycji system zbudowany na technologiach Sieci Semantycznej, i umożliwiający filtrowanie rekordów z ponad 200 źródeł (bibliotek, archiwów, bibliotek cyfrowych itp.); wyniki wyszukiwania można prezentować w różnych formatach i schematach metadanych (m.in. XML, RDF, FOAF, MARCXML,RDA FRAD FRBR); użytkownik ma też m.in.dostęp do informacji o jednostce, w której zlokalizowany jest dany rekord oraz do innych dodatkowych danych; osoba poszukująca danych wzorcowych uzyskuje ponadto wskazówki dotyczące kompletności poszczególnych haseł i ich referencyjności; 3) konwersja plików – według autorów programu, to mocny punkt AUTHORIS; zarejestrowany użytkownik może importować i eksportować pliki z/do różnych formatów; rekordy mogą być pobierane z bibliotek, wydawnictw i innych instytucji; użytkownik może utworzyć nowe hasło wzorcowe za pomocą algorytmu uczenia; jeżeli dane hasło zostało już wprowadzone do systemu przez inne jednostki, to użytkownikowi zostaje wskazane najlepsze hasło; 4) automatyczne katalogowanie – za pomocą klienta protokołu Z39.50 użytkownik może przeszukiwać i wybierać rekordy katalogowe (w formatach MARC, MARC 21 i MARC XML) innych bibliotek w celu uzupełnienia danych; 5) wizualizacja informacji – system daje możliwość wyodrębnienia informacji dotyczących danego dzieła lub autora, korzystając online z danych różnych wydawców lub bibliotek.

Architekturę AUTHORIS tworzy kilka modułów przetwarzania informacji, system reguł konwersji i kontroli autorytatywnej oraz moduł Linked Data. Dane do systemu pobierane są z wydawnictw, bibliotek, agencji prasowych, czasopism online i baz danych. W artykule szerzej omówiono działanie modułu Linked Data oraz reguły przekształcania danych wzorcowych.

Wersję beta systemu uruchomiono w październiku 2012 r. Prototyp AUTHORIS testowano na Universidad Central Marta Abreu (Kuba). System z założenia ma być rozwijany jako platforma open source, a po etapie próbnym moduły konfiguracyjne AUTHORIS będą dostępne w Google Code na licencji GNU General Public License v. 3.0.

Do oceny systemu zastosowano test uczenia (learning test) przygotowany w ramach testów oceniających zasady katalogowania RDA. Uczestniczyło w nim 16 użytkowników (w tym 6 wykwalifikowanych, doświadczonych bibliotekarzy), mających dostęp do rekordów 32 bibliotek i wydawnictw w Hiszpanii i Stanach Zjednoczonych. Skorzystali oni z 3000 rekordów bibliograficznych, wykonując m.in. automatyczne katalogowanie, przekształcanie rekordów, przeszukiwanie i tworzenie słowników itp., w celu  ich transformacji w różne formaty bibliograficzne i utworzenia plików podobnych do VIAF. Następnie badano skuteczność systemu na podstawie rekordów wygenerowanych automatycznie przez AUTHORIS podczas konwersji danych z MARC, MARC 21, FOAF, Dublin Core, RDA lub XBRL na potrzeby ich wykorzystania w chmurze Linked Data. Najwięcej błędów podczas tych operacji pojawiło się w rekordach w formatach ISAD-G (International Standard for Archival Description – General) oraz EAD. Przekształcenia rekordów w pozostałych formatach nie wpłynęły znacząco na ich jakość.

We wnioskach stwierdzono, że w kontekście rozwoju systemów kontroli autorytatywnej bardzo duże znaczenie ma współdziałanie i powiązania ośrodków bibliograficznych z innymi instytucjami. Tymczasem rozwój międzynarodowej kontroli autorytatywnej wydaje się być powolny i ograniczony przede wszystkim do bibliotek narodowych lub bardzo dużych bibliotek. Instytucje pozabiblioteczne (szczególnie wydawnictwa i firmy księgarskie) pozostają z boku, pomimo ich dużego potencjału w tworzeniu haseł wzorcowych, przydatnych nie tylko w systemie kontroli autorytatywnej, ale także w wymianie informacji. AUTHORIS jest narzędziem, z którego mogą korzystać różne organizacje i jednostki, nie tylko biblioteczne czy bibliograficzne. Zastosowany w nim model kontroli autorytatywnej jest elastyczny i  otwarty. Jednak, zdaniem autorów, jeżeli w przyszłości, w zintegrowanych systemach bibliotecznych, znajdą zastosowanie technologie Linked Data, potraktowane jako element globalnej rzeczywistości, a nie tylko rozszerzenie związane z katalogowaniem według RDA, to tego typu aplikacje jak AUTHORIS przestaną być potrzebne.

Komentarze wyłączone.