Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Tagi a język kontrolowany: porównanie opisu książek z dziedziny bibliotekoznawstwa i informacji naukowej

Autor: Małgorzata Waleszko,

Kategorie: Bibliotekoznawstwo i informacja naukowa jako dziedzina, Źródła informacji, Opracowanie informacji

Tagi: , , , , , , , ,

Zostaw komentarz

Folksonomie postrzegane są często w piśmiennictwie naukowym jako potencjalnie alternatywna wobec formalnego opisu metoda organizacji i indeksowania dużych zasobów informacyjnych; przeprowadzono też wiele badań porównujących skuteczność, precyzyjność i zgodność języka naturalnego i słowników kontrolowanych (zob. BABIN [1], [2], [3]), w tym m.in. języka haseł przedmiotowych Biblioteki Kongresu (LCSH) (por. BABIN 2010/2/115), jako narzędzi dostępu rzeczowego do różnego typu źródeł online. Autorzy postanowili przeanalizować semantyczne relacje między społecznymi tagami i hasłami LCSH, w dwóch nowych kontekstach: dziedziny bibliotekoznawstwa i informacji naukowej (BIN) i dwujęzycznego środowiska (angielski i chiński), sprawdzając odniesienia między formalnymi i nieformalnymi znacznikami używanymi do opisu książek BIN, różnice między oznaczeniami w obu językach, oraz stopień, w jakim tagi i hasła LSCH się uzupełniają.

W artykule, na podstawie przeglądu literatury przedmiotu, przybliżono najważniejsze cechy systemów organizacji i reprezentacji wiedzy oraz wyniki prac badawczych analizujących użyteczność tagów, ich dopasowanie do LCSH i możliwość ich wykorzystania w usługach bibliotecznych, a następnie omówiono szczegółowo przyjętą w referowanym badaniu metodologię gromadzenia i analizy danych oraz rezultaty tej ostatniej. W ramach projektu porównywano oznaczenia ze stron LibraryThing i Douban Dushu (książkowa sekcja chińskiego serwisu społecznego katalogowania DouBan), przypisane 500 książkom w każdym z języków, oraz hasła przedmiotowe z rekordów bibliograficznych tych publikacji, znalezione w katalogach Biblioteki Kongresu i Biblioteki Narodowej Chin (formaty USMARC i CNMARC). Wśród oznaczeń przypisanych 1000 publikacjom z próby, zidentyfikowano na tej podstawie 3781 unikalnych tagów i 1116 formalnych terminów. Z ustaleń autorów wynika, że w BIN zauważyć można wyższy odsetek nakładających się terminów tematycznych, w obu zbiorach znaczników, niż w przypadku innych dyscyplin, oraz większe podobieństwo (mierzone współczynnikiem Jaccarda) między często używanymi w nich słowami kluczowymi. W przypadku tagów z BIN można przy tym mówić o pewnych ograniczeniach typowych dla niekontrolowanych słowników (por. BABIN 2010/3/187). Badanie wykazało również, że różnice językowe mają wpływ na społeczne tagowanie – liczba chińskich tagów (zarówno całkowita, jak i na każdą książkę) jest dużo mniejsza niż angielskich etykiet. Najczęściej używane tagi angielskie składają się z pojedynczych wyrazów, w przeciwieństwie do wielowyrazowych haseł kontrolowanego słownika. Różnice w liczbie znaków między najczęściej używanymi chińskimi terminami z obu analizowanych zbiorów to odpowiednio 3 i 4. Wzory zachowań użytkowników angielskojęzycznych i posługujących się chińskim, przy tagowaniu książek są jednak bardzo podobnie.

W podsumowaniu autorzy stwierdzają, że mimo ograniczeń związanych ze stosowaniem tagów w katalogowaniu i indeksowaniu, mogą one stanowić uzupełniające źródło poszerzające i wzbogacające systemy kontrolowanego słownictwa, a hybrydowe podejście do obu ww. zadań jest potencjalnie użytecznym rozwiązaniem poszerzającym możliwości dostępu do zasobów informacyjnych, zwłaszcza gdy założy się dalszy szybki technologii ułatwiających sprawdzanie niespójności w folksonomiach i kontrolowanie opcji słowników kontrolowanych w społecznym tagowaniu.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>