Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

BOLD – duże i otwarte dane powiązane: prognozy

Autor: Małgorzata Waleszko,

Kategorie: Opracowanie informacji, Technologia informacyjna i bibliotekarska

Tagi: , , , ,

Zostaw komentarz

  • Facebook
  • Wykop
  • Twitter
  • Gwar
  • StumbleUpon
  • Email

Analitykę big data (olbrzymich, zmiennych i zróżnicowanych zbiorów danych pozyskiwanych z różnych kanałów komunikacyjnych, operacji dokonywanych w sieci, transakcji handlowych, informacji wymienianych prze urządzenia połączone z internetem, treści tworzonych przez użytkowników oraz różnego typu krajowych i lokalnych urządzeń i systemów monitoringu) uznaje się za jeden z najbardziej znaczących trendów technologicznych, kształtujących społeczno-ekonomiczny charakter globalnej gospodarki. Powiązanie gromadzenia dużych masywów danych z otwartym dostępem do nich dla wszystkich zainteresowanych stron zwiększa istotnie potencjał big data w odniesieniu do możliwości rozwiązywania problemów społecznych i usprawniania funkcjonowania publicznych i prywatnych jednostek w cyfrowym ekosystemie, a jednocześnie – ryzyko związane z wykorzystywaniem tych zasobów. Autorka, na podstawie przeglądu literatury przedmiotu, przeanalizowała w tekście specyfikę i zakres BOLD (Big and Open Linked Data) oraz stosowane obecnie techniki analityczne. Omówili także dotychczas przeprowadzone badania poświęcone temu fenomenowi, a następnie przedyskutowała możliwe kierunki ewolucji masywów otwartych, powiązanych danych w przyszłości, w kontekście złożoności ich zbiorów i zarządzania danymi z różnych źródeł.

W pierwszej części tekstu scharakteryzowano obecną, wstępną fazę rozwoju BOLD (BOLD 0.0), której typową cechą jest nieustrukturyzowany i niejednorodny charakter oraz słaba jakość agregowanych danych, a wzywania związane z ich użytecznością dotyczą m.in. konieczności „czyszczenia” zbiorów danych oraz stworzenia ich odpowiedniej architektury, a także trudności z interpretacją danych, ze względu na straty kontekstualnego znaczenia. Do dalszych, możliwych trajektorii rozwoju BOLD zaliczono: i) wersję C-FOLD (Complex and Fragmented Open Linked Data), czyli BOLD 1.0, cechujące się problemami analitycznymi ze względu na mieszaninę ustrukturyzowanych i nieustrukturyzowanych danych w różnych formach, a jednocześnie – wykorzystaniem bardziej wyrafinowanych mechanizmów analitycznych, ii) S-COLD (Selective and Comprehensive Open Linked Data), czyli BOLD 2.0. Typowe dla tego etapu ma być stosowanie rygorystycznych procedur filtrowania i łączenia tylko wybranych danych, iii) I-TOLD (Integrated and Targeted Open Linked Data), czyli BOLD 3.0, bazujące na zintegrowanych platformach danych i aglomeracji optymalnych, a jednocześnie przystępnych technologii, pozwalających na osiąganie wytyczonych celów. W tej dojrzałej wersji, architektura wymagana do wykonywania procesów analitycznych dostępna byłaby na zasadach open source i możliwa do adaptacji przy realizacji konkretnych celów w sektorze publicznym. Podkreślono, że wraz ze wzrostem złożoności i zakresu agregowanych zestawów danych, rosła będzie liczba wyzwań związanych z ich przetwarzaniem i wykorzystywaniem, istotne jest więc by organizacje akademickie i biblioteczne potrafiły przyciągnąć ekspertów w zakresie analityki BOLD, świadomych praktycznych implikacji związanych z rozwojem tej technologii.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>