Linked Data w bibliotekach cyfrowych: stan obecny i przyszłe trendy
,Kategorie: Biblioteki jako kolekcje, Technologia informacyjna i bibliotekarska
Tagi: biblioteki cyfrowe, biblioteki narodowe, linked data, Sieć 3.0, Sieć Semantyczna
Możliwość komentowania Linked Data w bibliotekach cyfrowych: stan obecny i przyszłe trendy została wyłączona
Poprawa dostępności oferowanych przez biblioteki zbiorów cyfrowych i jakości publikowanych przez nie danych bibliograficznych oraz możliwość realizacji bardziej złożonych kwerend wymaga powiązania danych z zewnętrznymi źródłami oraz dzielenia się zasobami w sieci www w formie czytelnej dla komputerów. Pociąga to za sobą konieczność usprawnienia metod zarządzania obecnymi bibliotekami cyfrowymi i semantycznego opisu treści oraz korzystania z nowych form współpracy, m.in. przy pomocy sieci społecznościowych, społeczności specjalistów, czy aplikacji łączących dane, prezentacje i funkcje z wielu źródeł. Linked Data czyli technologie publikowania z wykorzystaniem standardów sieciowych, umożliwiają łączenie związanych ze sobą kontekstowo danych i ich rozpowszechnianie na zasadach projektowania wytyczonych przez Tima Bernersa-Lee w 2006 r. i zgodnie z zaproponowanym przez niego w 2010 r. pięciogwiazdkowym modelem publikacji w otwartym środowisku sieciowym, implementacja usług Linked Data w bibliotekach wiąże się jednak z wieloma wyzwaniami natury technicznej, konceptualnej i prawnej. W artykule, na podstawie systematycznego przeglądu literatury przedmiotu z ostatnich 5 lat, omówiono obecne wykorzystanie Linked Data w bibliotekach cyfrowych (LDBC) i najważniejsze wdrożenia tej technologii na świecie.
Pytania badawcze postawione przez autora dotyczyły: korzyści związanych z LDBC (por. babin.bn.org.pl/?p=1742), używanych w tym celu ontologii i słowników, opisywanych w piśmiennictwie problemów i przyszłych trendów dotyczących badań nad LDBC. W zbiorze analizowanego piśmiennictwa znalazły się artykuły i inne publikacje rejestrowane w Google Scholar, Scopus, ACM i Springer, i odnoszące się do 5 największych cyfrowych bibliotek narodowych na świecie, prowadzących prace nad implementacją Linked Data (por. babin.bn.org.pl/?p=3380), a także informacje z witryn internetowych tych instytucji. W pierwszej części artykułu zreferowano badania przeprowadzone przez W3C Library Linked Data Incubator Group, poświęcone zmianom prezentacji informacji bibliograficznej i inicjatywom publikowania danych bibliotek w schemacie RDF w Sieci Semantycznej. Następnie przybliżono specyfikę projektów LDBC realizowanych w Bibliotece Narodowej Francji, w ramach Europeany (zob. babin.bn.org.pl/?p=2954), w Bibliotece Kongresu, Bibliotece Brytyjskiej (zob. babin.bn.org.pl/?p=3027) i Bibliotece Narodowej Hiszpanii.
Do zalet wykorzystania technologii Linked Data w bibliotekach cyfrowych zaliczono: a) poprawę widoczności danych, b) możliwość ustalenia powiązań z innymi serwisami online, c) ułatwienie konwersji tematów w SKOS (Simple Knowledge Organization System, czyli w Uproszczonym Systemie Organizacji Wiedzy), d) poprawę odzyskiwania otwartych danych, e) zapewnienie współdziałania danych bez wpływu na modele ich źródeł, f) możliwość sprawdzania i ponownego używania powiązanych metadanych z wielu instytucji, g) możliwość modelowania interesujących użytkownika rzeczy związanych z zasobem bibliograficznym, takich jak ludzie, miejsca, wydarzenia czy tematy, h) poprawę wiarygodności danych przez adnotacje użytkowników. Wykorzystywane w badanych instytucjach modele, słowniki i ontologie to Dublin Core, BIBO, BIO, FOAF, FRBR, FRAD, FRSAD, ISBD, IMTERMARC, MADS/RDF, XML-EAD, OAI-ORE, RDF, RDF Schema (RDFS), OWL, RDA, SKOS, WGS84 i EVENT. Każda z bibliotek pracuje tez nad własnymi narzędziami generowania RDF (np. Marimba w Bibliotece Narodowej Hiszpanii)
Wśród referowanych w literaturze problemów wymieniono: i) trudności z katalogowaniem zasobów, ii) wielość słowników dla tych samych metadanych, iii) brak uzgodnień dotyczących dostarczania metadanych i trudności z migracją danych do nowych modeli, iv) potrzebę opracowania narzędzi przetwarzania i wykorzystywania Linked Data, v) brak ekspertów z różnych dziedzin, vi) problemy z mapowaniem (np. niemożność ekstrakcji wszystkich podstawowych relacji modelu FRBR z rekordów MARC), vii) zapotrzebowanie na bardziej użyteczne powiązania zbiorów danych, viii) definicje praw własności i kontroli, ix) kontrole jakości zbiorów danych, x) brak wskaźników wykorzystania Linked Data.
Oczekiwania związane z dalszymi badaniami nad LDBC dotyczą głównie większej liczby dostawców zbiorów danych i szerszego społecznego zaangażowania w katalogowanie i kontrolę jakości publikowanych danych, identyfikacji najlepszych praktyk, rozwoju narzędzi ułatwiających migrację danych, przeglądanie, pozyskiwanie, wykorzystywanie i zachowywanie Linked Data, mapowanie powiązań, wizualizację i analizę danych, normalizacji zasad zarządzania słownikami RDF i URI, opracowania standardów danych kompatybilnych z Linked Data oraz szerszej dyskusji na temat praw związanych z Linked Data.