Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Ewaluacja funkcjonalności językowej w bibliotecznych bazach danych

Autor: Małgorzata Waleszko,

Kategorie: Wykorzystanie informacji i socjologia informacji, Źródła informacji, Technologia informacyjna i bibliotekarska

Tagi: , , , , , ,

Zostaw komentarz

Komunikacja naukowa w swoich wielu formach ma obecnie charakter globalny i wielojęzyczny, a choć angielski pozostaje lingua franca dla większości międzynarodowych czasopism naukowych, badacze z wielu dyscyplin, w tym zwłaszcza lingwiści, mają zróżnicowane potrzeby językowe i poszukują dostępu do zagranicznych tytułów i wyników badań naukowych z różnych krajów. Współczesne technologie językowe dla odbiorców i materiałów nieanglojęzycznych, wykorzystywane w bibliotecznych bazach danych rozwijają się bardzo dynamicznie i podlegają szybkim zmianom. W artykule omówiono bieżące trendy związane ze zmianami i dostosowywaniem ustawień językowych i lokalizacji treści, a następnie przedyskutowano funkcje oferowane w bazach największych światowych dostawców, pozwalające na wyszukiwanie i pozyskiwanie informacji w językach innych niż angielski i nawigację między obcojęzycznymi zasobami.

Do ewaluacji wybrano bazy EBSCO Academic Search Complete (ASC), Gale Academic OneFile, JSTOR, ProQuest Linguistic and Language Behaviour Abstracts (LLBA) i WorldCat (serwis FirstSearch). Sprawdzano możliwości przeszukiwania ich zawartości w różnych językach w prostym wyszukiwaniu przez słowa kluczowe tworzone przy pomocy translatora Google. Celem autora nie była szczegółowa analiza algorytmów wyszukiwawczych i technik przetwarzania języka naturalnego, lecz raczej przybliżenie bibliotekarzom i pracownikom informacji naukowej (w tym zwłaszcza specjalistom współpracującym z wydziałami filologicznymi, lingwistycznymi i odbiorcami z wielojęzycznych, międzynarodowych środowisk) technologii dla użytkowników końcowych, wprowadzanych przez dostawców produktów dla bibliotek i sektora informacyjnego. W ramach badania sprawdzano szczegółowo opcje językowe każdej z baz, w tym obsługę formatu Unicode, różnych alfabetów i znaków diakrytycznych, automatyczne tłumaczenie artykułów w HTML, możliwość filtrowania wyników wyszukiwania według języka, obecność tezaurusów w języku angielskim i innych, możliwość zmiany języka interfejsu wyszukiwawczego, technologie głosowego odczytu tekstu. Następnie analizowano zdolność każdej z baz do rozpoznawania terminów wyszukiwawczych w różnych językach i alfabetach (udane wyszukiwania zdefiniowano jako te zwracające ponad 1000 wyselekcjonowanych rezultatów w wybranym języku).

Z dokonanego przeglądu wynika, że wszystkie badane platformy umożliwiają wyszukiwanie w językach wykorzystujących alfabet łaciński – najlepiej, w przypadku francuskiego, hiszpańskiego i niemieckiego, wypadły bazy ASC, JSTOR i WorldCAT; natomiast ich wsparcie dla lokalizowanie zasobów z wykorzystaniem języków zapisywanych pismem innym niż łaciński (rosyjskiego, arabskiego, hebrajskiego czy chińskiego) jest niezadowalające (najlepsze wyniki pod tym względem uzyskano w WorldCat). Zaznaczono przy tym, że dostępność różnych opcji językowych nie oznacza, że dana baza faktycznie zawiera treści w danych językach, a także, że technologie tego typu są stale rozwijane i udoskonalane, wraz z ich wprowadzaniem na nowe rynki, co warto uwzględnić przy wyborze produktów potencjalnie najlepiej odpowiadających potrzebom wielojęzycznych i zagranicznych użytkowników. Wskazano także na potrzebę zwrócenia uwagi na dostępność treści w językach innych niż angielski w otwartych repozytoriach i podejmowanie w środowisku bibliotecznym inicjatyw na rzecz poprawy dostępności takich materiałów w bazach oferowanych za pośrednictwem bibliotek.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>