Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Ewaluacja częściowo zautomatyzowanych narzędzi tworzenia metadanych

Autor: Małgorzata Waleszko,

Kategorie: Opracowanie informacji, Technologia informacyjna i bibliotekarska

Tagi: , , , , ,

Zostaw komentarz

Ze względu na szybki wzrost liczby wszystkich typów zasobów informacyjnych udostępnianych przez biblioteki oraz ograniczone budżety tych instytucji, możliwości odpowiedniego, manualnego katalogowania wszystkich publikowanych materiałów są coraz mniej realistyczne, istotnym problemem dla całej społeczności bibliotecznej staje się więc opracowanie najbardziej efektywnych sposobów tworzenia rekordów bibliograficznych i zapewnienie tym samym użytkownikom szans na dotarcie do poszukiwanych materiałów. Jednym z obiecujących podejść do zarządzania rosnącą liczbą informacji jest wdrażanie półautomatycznych narzędzi tworzenia metadanych, czyli wykorzystywanie oprogramowania do produkcji rekordów metadanych pod większą lub mniejszą kontrolą ekspertów.

W formie idealnej, aplikacje takie są zdolne do ekstrakcji danych z ustrukturyzowanych i nieustrukturyzowanych zasobów informacyjnych i generowania wysokiej jakości metadanych, ułatwiających nie tylko tworzenie rekordów bibliograficznych, lecz również semantyczną współoperatywność – kluczowy czynnik dzielenia się zasobami i wyszukiwania informacji w środowisku sieciowym. Główne zalety takich rozwiązań to skalowalność, potencjalne oszczędności kosztów i czasu personelu, który może się dzięki temu koncentrować na bardziej konceptualnie wymagających zadaniach oraz możliwość tworzenia bardziej spójnych rekordów i poprawy w związku z tym dostępności materiałów bibliotecznych.

Ponieważ ewaluacja obecnego rynku narzędzi tworzenia metadanych jest niezmiernie istotna w związku z szybkim rozwojem cyfrowych repozytoriów, a liczba opracowań dotyczących rozwoju i implementacji takich produktów jest nadal stosunkowo niewielka, w artykule przeprowadzono porównawczą analizę dostępnego oprogramowania, dokonując oceny jego cech, zasad działania i funkcji. W badaniu skoncentrowano się głównie na instrumentach o otwartym kodzie źródłowym, gotowych do wykorzystania w bibliotekach i innych instytucjach kultury i dziedzictwa. Na wstępnie omówiono obecne techniki i mechanizmy maszynowego generowania metadanych, takie jak ekstrakcja i gromadzenie meta-tagów, ekstrakcja treści, automatyczne indeksowanie, eksploracja tekstu i danych, automatyczne generowanie danych zewnętrznych (ang. extrinsic data auto-generation) i społeczne tagowanie. Następnie przybliżono wyniki porównania 39 generatorów, z których 19 wspiera zbieranie (ang. harvesting) meta-znaczników, 12 – jakąś formę ekstrakcji treści, 7 – automatyczne indeksowanie, 13 – formę extrinsic data auto-generation, 2- społeczne tagowanie. Omówiono także wyzwania związane z rozwojem zautomatyzowanych narzędzi tworzenia metadanych oraz bariery utrudniające ich włączanie do codziennych procedur związanych z opisem i organizacją informacji. Za największy problem uznano dostosowanie większości dostępnych generatorów do tworzenia jedynie niektórych elementów metadanych, a nie ich pełnego zakresu; dużo czasu i wysiłku należałoby więc poświęcić integracji różnych programów w spójny zestaw dostosowany do potrzeb bibliotek. Ze względu na niestabilność rozwoju otwartych projektów programistycznych, wiele instytucji nie chce się też decydować na inwestowanie ograniczonych środków w implementację niepewnych rozwiązań. W podsumowaniu przedstawiono więc kroki jakie należy podjąć, by środowisko biblioteczne mogło poważnie rozważać wdrożenie częściowo zautomatyzowanych narzędzi do procedur tworzenia metadanych i przedyskutowano możliwe dalsze kierunki rozwoju takiego oprogramowania.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>