Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

System Kramerius w czeskich i słowackich bibliotekach

Autor: Alina Nowińska,

Kategorie: Źródła informacji, Technologia informacyjna i bibliotekarska, Biblioteki jako kolekcje, Działalność biblioteki

Tagi: , , , , , , , ,

Zostaw komentarz

W artykule omówiono czeski system zarządzania treścią Kramerius (oprogramowanie open source dystrybuowane na licencji GNU GPL v3), za pośrednictwem którego, przez strony 20 bibliotek naukowych Czech oraz biblioteki Uniwersytetu w Bratysławie, tworzone jest cyfrowe repozytorium książek i czasopism. Projekt koordynowany jest przez Bibliotekę Narodową Czech (BNCz). Biblioteka cyfrowa Kramerius pod koniec 2011 roku zawierała blisko 16 mln stron dokumentów, najwięcej wprowadziła ich BNCz – 8,1 mln stron, w tym 5,1 mln stron czasopism.

Tylko w ciągu 2011 r. na serwerze BNCz przybyło pół mln stron czasopism, w tym zawartość XIX-wiecznych gazet. Przedstawiono trudności na jakie napotykają użytkownicy systemu. Biblioteki zainstalowały jego różne wersje, co zmuszało czytelników do zapoznania się ze specyfiką każdej z nich. Dopiero nowa, czwarta wersja Krameriusa udostępnia skany w formacie obrazowym JPEG, a tekst odczytany oprogramowaniem OCR przedstawiony jest w uniwersalnym formacie PDF. Umożliwia to przeglądanie zasobów repozytorium dowolną przeglądarką internetową bez konieczności instalowania wtyczki (plug-in) do odczytu formatu DjVu, używanego przez wcześniejsze wersje systemu. Znaczna część zasobów Krameriusa dostępna jest nie tylko w formie szczegółowego opisu bibliograficznego i skanów zawartości, ale też tekstowej, co umożliwia wyszukiwanie pełnotekstowe. Problemy z tym związane to błędy odczytu tekstu przez program OCR (np. mylenie liter „e” i „c” oraz „u” i „n”), niepoprawna interpretacja wyrazów w oryginale przenoszonych między wierszami (zapisanych z dywizem) oraz lokalizacja znalezionych wyrazów z dokładnością do strony. Niektóre strony nie były odczytane przez OCR, a tylko zeskanowane, więc nie są dostępne przez system wyszukiwania informacji.

Autor przedstawia też w tekście zalety Krameriusa, porównując go z bardzo popularnym austriackim systemem ANNO, zawierającym skany 6,5 mln stron dokumentów, ale nie zapewniającym opcji wyszukiwania pełnotekstowego. Dla użytkowników repozytorium najbardziej kłopotliwe są restrykcje prawa autorskiego. Niekiedy po wyświetleniu się fragmentu tekstu pojawia się informacja, że reszta jest chroniona prawnie. Dostęp publiczny jest przez biblioteki limitowany, np. BNCz umożliwia dostęp z domu do czasopism sprzed 1890 r., a do książek – sprzed 1880 r.; Uniwersytet Mendla – do książek sprzed 1920 r., Biblioteka Regionalna Moraw – do czasopism sprzed 1940 roku. Późniejsze dokumenty, chronione prawem autorskim, są dostępne wyłącznie z komputerów bibliotecznych.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>