Digitalizacja i długotrwałe zachowanie dokumentów dźwiękowych: wstępne studium Biblioteki Narodowej Czech
,Kategorie: Opracowanie informacji, Technologia informacyjna i bibliotekarska, Źródła informacji
Tagi: Biblioteka Narodowa Czech (Praga), Czechy, digitalizacja zbiorów, dokumenty audiowizualne, dokumenty dźwiękowe, formaty danych, metadane, normalizacja
Możliwość komentowania Digitalizacja i długotrwałe zachowanie dokumentów dźwiękowych: wstępne studium Biblioteki Narodowej Czech została wyłączona
W Czechach, uwaga bibliotek i innych instytucji pamięci była jak dotąd skoncentrowana na digitalizacji druków i rękopisów. Obecnie przyszła kolej na ewidencję, digitalizację, zabezpieczenie, długotrwałe zachowanie i udostępnianie dokumentów dźwiękowych. W tym celu Ministerstwo Kultury sfinansowało projekt utworzenia Wirtualnej Fonoteki Narodowej. W realizowanym w latach 2015-2020 projekcie uczestniczy ponad 500 instytucji, za koordynację działań oraz opracowanie założeń metodycznych odpowiadają Biblioteka Moraw w Brnie, Narodowe Muzeum Muzyki i Biblioteka Narodowa Czech.
Wstępną część projektu poświęcono ustaleniu jego celów, sposobów realizacji oraz wyborowi formatów archiwizacji i udostępniania plików, metadanych i narzędzi identyfikacji formatu. W tym celu zapoznano się zaleceniami międzynarodowych stowarzyszeń archiwów dźwiękowych (ARSC – Association for Recorded Sound Collection, IASAA – International Association of Sound and Audiovisual Archives ) i Biblioteki Kongresu oraz praktyką największych bibliotek i archiwów w Stanach Zjednoczonych i Wielkiej Brytanii. Wstępnie ustalono warunki jakie powinien spełniać wybrany format długotrwałego zachowania dokumentów dźwiękowych, zaliczając do nich między innymi: publiczną dostępność kodu źródłowego, możliwość migracji danych i nowelizacji, transparentność oraz niezależność od konkretnego sprzętu i oprogramowania. Przy zastosowaniu PMC (metoda zmiany sygnału dźwiękowego na cyfrowy) do długotrwałej archiwizacji, IASAA zaleca częstotliwość co najmniej 48 kHz (kiloherców), najlepiej – 96 kHz, poza granicą ludzkiego słuchu. W artykule szczegółowo scharakteryzowano m.in.:
1) stosowane przez największe biblioteki formaty archiwizacji plików dźwiękowych – WAVE (Waveform Audio File Format) i jego późniejszą modyfikację – BWF (Broadcast Wave Format). Mają one prostą strukturę, są zgodne z systemami operacyjnymi Windows, OSX i Linux, transparentne, otwarte i niepowiązane z jednym rodzajem sprzętu. Krótko omówiono też formaty AIFF i BWF oraz bezstratny kodek FLAC (Free Lossess Audio Codec);
2) formaty udostępniania zgromadzonych dokumentów dźwiękowych. O ich doborze powinny decydować możliwości transmisji, dostępne interfejsy i aplikacje. Za dogodne uznaje się MP3 i AAC należące do odmian MPEG. Formaty MP3 (MPEG 1, MPEG 2, Audio Layer III) są dostosowane do standardowej szybkości transferu danych – 128 kbps (kilobitów na sekundę) dla mono, 256 kpbs dla stereo (niekiedy 160 kbps dla mono i 320 kpbs dla stereo). Najnowszy standard – MPEG AAC (Advanced Audio Coding) posiada lepszą możliwość kompresji niż MP3. W podsumowaniu stwierdzono, że dla długotrwałej archiwizacji dokumentów dźwiękowych w Czechach zaleca się wybór formatu Wave i BWF, a w celu wyboru formatu udostępniania należy przetestować formaty FLAC, AAC i Ogg Vorbis;
3) systemy metadanych przydatne do opisu archiwizowanych dokumentów dźwiękowych. Za najdogodniejszy uważa się system Dublin Core (prosty, efektywny, umożliwia również opis stron www i druków) uzupełniony schematem MODS. Wysoko ocenia się PB Core, który bazuje na językau XML, więc można go uzupełniać standardami PREMIS i AES57. Dla potrzeb projektu proponuje się zastosowanie kombinacji Dublin Core i MODS, które to formaty już są w bibliotece narodowej stosowane do opisu obiektów w projekcie Narodowa Biblioteka Wirtualna. Dla opisu parametrów technicznych dokumentów dźwiękowych można wykorzystać formaty AudioMD i AES57, również PBCore pozwala na zapis tych elementów;
4) narzędzia przydzielania unikalnych identyfikatorów (DROID, Siegfried i FIDO) oraz walidacji poprawności (JHOVE weryfikujący BMF i Wave) i ekstrakcji metadanych (JHOVE, MediaInfo, FITS, Apache Tika, Exiftool i nowe narzędzie PET). Ze względu na integrację kilku etapów archiwizacji, za najwygodniejszy uznano JHOVE, choć wchodzi w rachubę FITS integrujący JHOVE, DROID i MediaInfo. Wyniki przedstawionych badań mają umożliwić wybór optymalnych rozwiązań systemowych i programistycznych na potrzeby cyfrowego archiwum dźwiękowego.