Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Wielkie biblioteki cyfrowe i ich wpływ na usługi informacji naukowej

Autor: Małgorzata Waleszko,

Kategorie: Opracowanie informacji, Biblioteki jako kolekcje, Działalność biblioteki

Tagi: , , , , , , , , , , ,

Możliwość komentowania Wielkie biblioteki cyfrowe i ich wpływ na usługi informacji naukowej została wyłączona

Rozwój cyfrowych mediów i zasobów online oraz ewolucja sieci 2.0 w kierunku Sieci Semantycznej obniżyły atrakcyjność bibliotecznych usług informacji naukowej (UIN) – w erze big data, czyli analityki olbrzymich zbiorów cyfrowych danych z różnych źródeł, coraz częściej kwestionuje się też znaczenie i miejsce służb informacyjnych w obecnym cyfrowym ekosystemie. W dyskusjach tych pomija się zazwyczaj wpływ, jaki ma na UIN rozbudowa wielkich bibliotek cyfrowych (WBC), takich jak jak Google Books, Europeana czy HathiTrust, agregujących publikacje pochodzące z wielu projektów masowej digitalizacji zbiorów bibliotecznych. Zasoby takich masowych repozytoriów sięgają dziesiątek milionów tytułów, zarówno tych znajdujących się w domenie publicznej, jak i chronionych prawem autorskim, a ich dostępność zmienia znacząco sposób analizy tekstów przez użytkowników oraz przez samych bibliotekarzy. Potencjalnie, WBC mogą zapewnić bibliotekom olbrzymie korpusy cyfrowych tekstów, dostępnych do ekstrakcji i analizy danych, czyli wirtualne, przygotowane do celów usług informacyjnych kolekcje odpowiadające zakresowi zbiorów drukowanych, oferując jednocześnie znacznie większe możliwości eksploracji. Ich faktyczna przydatność jako serwisów mogących zastąpić UIN budzi jednak wiele wątpliwości. W artykule przedyskutowano bezpośrednie, pozytywne i negatywne efekty tych repozytoriów oraz konsekwencje związane poleganiem na WBC kosztem lokalnych zbiorów drukowanych.

Analizę oparto na wynikach czterech badań przeprowadzonych przez autora i Ryana Jamesa w latach 2012 – 2015, w ramach których sprawdzano, na próbach losowo dobranych tytułów z Google Books i Hathi Trust, poziom dostępności książek w tych repozytoriach i możliwości ich wyszukiwania, języki i różnorodność kulturową (na próbie tekstów w języku japońskim), zróżnicowanie przedmiotowe (na próbie książek na temat Hawajów i Pacyfiku) i różnorodność językową (weryfikując poziom dostępność publikacji w języku hiszpańskim), a następnie klasyfikowano napotkane błędy i obliczono ich wartości procentowe. Wśród ustalonych na tej podstawie wad WBC (por. BABIN 2008/3/223, BABIN 2009/3/214, BABIN 2010/2/104) wymieniono niską dokładność metadanych (odsetek zanotowanych w jednym z badań błędów wyniósł niemal 37%), złą jakość skanów (zamazany druk, strony wyświetlane do góry nogami itp. ), błędnie implementowaną technologie OCR (nielogiczne i nieczytelne wyniki rozpoznawania tekstu, w tym zwłaszcza znaków niełacińskich), brak kontroli jakości przy masowej digitalizacji, problemy z reprezentacją językową (dominacja książek w języku angielskim), brak różnorodności tematycznej w kolekcjach źródłowych oraz problemy z wyszukiwaniem, w tym lokalizacją określonych tomów w konkretnych wydaniach dzieł wielotomowych. Wskazano, że najbardziej zauważalnym problemem jest brak uniwersalności i kompletności, mających być założeniami projektów globalnych bibliotek cyfrowych. Ewidentne jest również, że przekład części książek na formę cyfrową nie jest odpowiedni i funkcjonują one w wirtualnym świecie wyłącznie w formie niedokładnych reprodukcji treści, tracąc część atrybutów warunkujących efektywność technologii druku i unikatowość poszczególnych wydań, szczególnie w kontekście określonych kultur, co może mieć negatywny wpływ na jakość UIN i podważać zaufanie użytkowników do bibliotek, zwłaszcza tych, które chcą bazować na masowych repozytoriach jako zapleczu usług informacyjnych.

Komentarze wyłączone.