Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

W kierunku integracji zasobów bibliotecznych i Wikipedii: automatyczne indeksowanie przedmiotowe rekordów bibliograficznych

Autor: Małgorzata Waleszko,

Kategorie: Źródła informacji, Opracowanie informacji, Technologia informacyjna i bibliotekarska

Tagi: , , , , ,

Zostaw komentarz

W ciągu ostatniej dekady obserwuje się stały spadek liczby użytkowników bibliotecznych stron www i katalogów online, i coraz mniej konsumentów informacji wykorzystuje zasoby bibliotek na potrzeby informacyjne i traktuje strony biblioteczne jako punkt startowy kwerend. Wg badań, odsetek takich zachowań wynosi mniej niż 1%,natomiast 84% wyszukiwań informacji w Internecie zaczyna się od silników typu Google, a dominującym paradygmatem lokalizowania potrzebnych danych staje się model Google-Wikipedia, w którym internauta kieruje zapytanie do Google, a następnie korzysta z jednego z odsyłaczy do artykułów z Wikipedii, widocznych zazwyczaj na pierwszych pozycjach w wynikach wyszukiwania. Aby zwiększyć widoczność i wykorzystanie zbiorów bibliotek w środowisku online, w artykule zaproponowano ich powiązanie z Wikipedią i przedyskutowano wagę i potrzebę takiej integracji, przedstawiając zalety najpopularniejszej internetowej encyklopedii w porównaniu z tradycyjnymi słownikami kontrolowanymi, oraz argumenty dowodzące, że linkowanie jej artykułów z powiązanymi z nimi tematycznie rekordami bibliograficznymi pozwoli z jednej strony na poprawę jakości usług bibliotek, a z drugiej – wzbogaci jej hasła i da użytkownikom szansę zdobycia pogłębionej wiedzy na interesujące ich tematy. Przedstawiono również rozwój automatycznego systemu do indeksowania przedmiotowego bibliotecznych rekordów metadanych pojęciami z Wikipedii.

W dyskusji autorzy powołują się m.in. na raport opublikowany w 2009 r. przez OCLC, wg którego większość ankietowanych użytkowników katalogów online uznała dodanie większej liczby informacji tematycznych do rekordów metadanych za najbardziej pomocny krok w kierunku poprawy jakości danych katalogowych, i tym samym poprawy efektywności wyszukiwania informacji o treści dokumentów. Sugerują też, że wykorzystanie pojęć z Wikipedii jako dodatkowego lub alternatywnego słownika kontrolowanego w OPAC jest dobrą odpowiedzią na te oczekiwania, jako że zapewnia olbrzymią liczbę szczegółowych haseł, uzupełniających tradycyjne narzędzia opisu rzeczowego używane obecnie przy indeksacji materiałów bibliotecznych. Może być też pierwszym etapem pełnej integracji Wikipedii i zasobów bibliotecznych (por. babin.bn.org.pl/?p=2372), mającej zapewnić dwukierunkowy przepływ informacji i użytkowników między tą encyklopedią a bibliotekami. W takim środowisku, internauci mogliby rozpoczynać wyszukiwania od dowolnego z tych dwóch źródeł i w miarę potrzeb nawigować tam i z powrotem między nimi. Od strony bibliotecznej, użytkownicy przeszukujący, bądź przeglądający OPAC widzieliby przedmiotowe metadane każdej pozycji w formie zestawu tematów Wikipedii połączonych hiperlinkami z odpowiadającymi im artykułami, i mogli przy ich pomocy przeglądać zbiory danej instytucji, a także zdobywać w encyklopedii dodatkową wiedzę w razie natknięcia się na nieznane pojęcie lub temat. Od strony Wikipedii, użytkownicy, którzy znaleźli się na którejś z jej tematycznych stron, otrzymywaliby listę dodatkowych publikacji ściśle powiązanych z hasłem, a każda pozycja w tym zestawie odsyłałaby do odpowiadającego jej rekordu w WorldCat.org, pozwalającego z kolei na sprawdzenie jej dostępności w lokalnej bibliotece.

Spełnienie tej wizji wymaga powiązania linkami indywidualnych artykułów encyklopedii z odpowiadającymi im rekordami w WorldCat. W tekście opisano szczegółowo projekt i rozwój uczącego się systemu (ang. machine learning) pozwalającego na automatyzację z dużym poziomem dokładności pierwszego kierunku proponowanego procesu indeksacji, przyjętą przy jego opracowaniu metodologię (wykorzystano m.in. narzędzie Wikipedia- Miner) oraz metodę i wyniki ewaluacji tego oprogramowania. Uznano, że stworzony prototyp może pomóc bibliotekom w budowie efektywnego sytemu opisu zawartości treściowej i wskazano na konieczność dalszych prac nad kolejnym etapem integracji, czyli automatyzacją procesu uzupełniania artykułów Wikipedii listami odpowiednich materiałów bibliotecznych przez semantyczne dopasowania rekordów katalogowych i tekstowej zawartości wpisów encyklopedii przy pomocy  botów.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>