Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Tag: OCR

Dziedzictwo kulturowe w kontekście cyfrowego szumu: dziewiętnastowieczne gazety w cyfrowym archiwum

Autor: Małgorzata Waleszko,

Kategorie: Źródła informacji, Technologia informacyjna i bibliotekarska, Biblioteki jako kolekcje

Tagi: , , , , , , , , , ,

Zostaw komentarz

Biblioteka Narodowa Szwecji (BNS) realizuje od 20101 r. program masowej cyfryzacji historycznych szwedzkich gazet, traktując go w pierwszej kolejności, ze względu na ograniczenia oprogramowania do konwersji tekstu, jako zadanie związane z ochroną dziedzictwa kulturowego, a nie zapewniania dostępu i pełnej możliwości przeszukiwania digitalizowanych tekstów. Pierwszym tytułem, którego wszystkie egzemplarze przeniesiono w całości w formę cyfrową, był Aftonbladet – pismo założone w 1830 r. i znajdujące się w XIX wieku w czołówce najpopularniejszych dzienników. W artykule przeanalizowano zbiory tego periodyku z perspektywy teorii transformacji mediów, omawiając różnice między wersjami oryginalnymi i ich cyfrowymi surogatami, przyczyny powstałych rozbieżności oraz ich konsekwencje dla potencjalnych użytkowników. Autorzy skupili się na funkcjach infrastruktury technicznej bardziej niż kwestiach reprezentacji i treści, badając cyfrowy szum w bazie Svenska dagstidningar, powstały w efekcie pracy oprogramowania OCR i narzędzi automatycznej segmentacji i korekty tekstu. Przedyskutowali także jego instytucjonalne źródła, przybliżając procedury stosowane w Szwedzkim Centrum Konwersji Mediów (Mediakonverteringscentrum MKC) – placówce dokonującej konwersji historycznych drukowanych gazet na zlecenie BNS, i trudności napotykane przez jego pracowników.

więcej o Dziedzictwo kulturowe w kontekście cyfrowego szumu: dziewiętnastowieczne gazety w cyfrowym archiwum

Wielkie biblioteki cyfrowe i ich wpływ na usługi informacji naukowej

Autor: Małgorzata Waleszko,

Kategorie: Opracowanie informacji, Biblioteki jako kolekcje, Działalność biblioteki

Tagi: , , , , , , , , , , ,

Zostaw komentarz

Rozwój cyfrowych mediów i zasobów online oraz ewolucja sieci 2.0 w kierunku Sieci Semantycznej obniżyły atrakcyjność bibliotecznych usług informacji naukowej (UIN) – w erze big data, czyli analityki olbrzymich zbiorów cyfrowych danych z różnych źródeł, coraz częściej kwestionuje się też znaczenie i miejsce służb informacyjnych w obecnym cyfrowym ekosystemie. W dyskusjach tych pomija się zazwyczaj wpływ, jaki ma na UIN rozbudowa wielkich bibliotek cyfrowych (WBC), takich jak jak Google Books, Europeana czy Hathi Trust, agregujących publikacje pochodzące z wielu projektów masowej digitalizacji zbiorów bibliotecznych. Zasoby takich masowych repozytoriów sięgają dziesiątek milionów tytułów, zarówno tych znajdujących się w domenie publicznej, jak i chronionych prawem autorskim, a ich dostępność zmienia znacząco sposób analizy tekstów przez użytkowników oraz przez samych bibliotekarzy. Potencjalnie, WBC mogą zapewnić bibliotekom olbrzymie, korpusy cyfrowych tekstów dostępnych do ekstrakcji i analizy danych, czyli wirtualne, przygotowane do celów usług informacyjnych kolekcje odpowiadające zakresowi zbiorów drukowanych, oferując jednocześnie znacznie większe możliwości eksploracji. Ich faktyczna przydatność jako serwisów mogących zastąpić UIN budzi jednak wiele wątpliwości. W artykule przedyskutowano bezpośrednie, pozytywne i negatywne efekty tych repozytoriów oraz konsekwencje związane poleganiem na WBC kosztem lokalnych zbiorów drukowanych.

więcej o Wielkie biblioteki cyfrowe i ich wpływ na usługi informacji naukowej

Projekt Purposeful Gaming: praca jako zabawa, czyli o gamifikacji w instytucjach kultury

Autor: Małgorzata Waleszko,

Kategorie: Technologia informacyjna i bibliotekarska, Działalność biblioteki

Tagi: , , , , , , , , , , ,

Zostaw komentarz

W 2011 r. Biblioteka Narodowa Finlandii, we współpracy z firmą Microtask, tworzącą technologie dla crowdsourcingu, zainicjowały DigitalKoot (Cyfrowi Ochotnicy) – projekt wykorzystujący specjalnie zaprojektowane gry komputerowe w celu zaangażowania internautów do korekty, w ramach zabawy, błędów powstałych przy skanowaniu zbiorów historycznych czasopism przez OCR (Optical Character Recognition). Inicjatywa ta okazała się ogromnym sukcesem – w ciągu kilkunastu miesięcy tysiące wolontariuszy wykonało ponad 2,5 mln zadań, prawdziwym osiągnięciem DigitalKoot było jednak wprowadzenie gamifikacji do niekomercyjnych programów ochrony cyfrowej. W artykule omówiono genezę i definicje tego pojęcia (inaczej: grywalizacji, gryfikacji) oraz możliwości wykorzystania strategii gier do weryfikacji zdigitalizowanych tekstów przetworzonych przy użyciu oprogramowania OCR, wykorzystując jako przykład projekt o nazwie Purposeful Gaming & BHL realizowany od 2013 r. przez cztery amerykańskie instytucje zajmujące się ochroną dziedzictwa kulturowego i naturalnego.

więcej o Projekt Purposeful Gaming: praca jako zabawa, czyli o gamifikacji w instytucjach kultury