BOLD – duże i otwarte dane powiązane: prognozy

Autor: Małgorzata Waleszko, 14:03 11-08-2017

Kategorie: Opracowanie informacji, Technologia informacyjna i bibliotekarska

Tagi: analityka internetowa, big data, BOLD (Big and Open Linked Data), linked data, systemy organizacji wiedzy

Możliwość komentowania BOLD – duże i otwarte dane powiązane: prognozy została wyłączona

Analitykę big data (olbrzymich, zmiennych i zróżnicowanych zbiorów danych pozyskiwanych z różnych kanałów komunikacyjnych, operacji dokonywanych w sieci, transakcji handlowych, informacji wymienianych prze urządzenia połączone z internetem, treści tworzonych przez użytkowników oraz różnego typu krajowych i lokalnych urządzeń i systemów monitoringu) uznaje się za jeden z najbardziej znaczących trendów technologicznych, kształtujących społeczno-ekonomiczny charakter globalnej gospodarki. Powiązanie gromadzenia dużych masywów danych z otwartym dostępem do nich dla wszystkich zainteresowanych stron zwiększa istotnie potencjał big data w odniesieniu do możliwości rozwiązywania problemów społecznych i usprawniania funkcjonowania publicznych i prywatnych jednostek w cyfrowym ekosystemie, a jednocześnie – ryzyko związane z wykorzystywaniem tych zasobów. Autorka, na podstawie przeglądu literatury przedmiotu, przeanalizowała w tekście specyfikę i zakres BOLD (Big and Open Linked Data) oraz stosowane obecnie techniki analityczne. Omówili także dotychczas przeprowadzone badania poświęcone temu fenomenowi, a następnie przedyskutowała możliwe kierunki ewolucji masywów otwartych, powiązanych danych w przyszłości, w kontekście złożoności ich zbiorów i zarządzania danymi z różnych źródeł.

W pierwszej części tekstu scharakteryzowano obecną, wstępną fazę rozwoju BOLD (BOLD 0.0), której typową cechą jest nieustrukturyzowany i niejednorodny charakter oraz słaba jakość agregowanych danych, a wzywania związane z ich użytecznością dotyczą m.in. konieczności „czyszczenia” zbiorów danych oraz stworzenia ich odpowiedniej architektury, a także trudności z interpretacją danych, ze względu na straty kontekstualnego znaczenia. Do dalszych, możliwych trajektorii rozwoju BOLD zaliczono: i) wersję C-FOLD (Complex and Fragmented Open Linked Data), czyli BOLD 1.0, cechujące się problemami analitycznymi ze względu na mieszaninę ustrukturyzowanych i nieustrukturyzowanych danych w różnych formach, a jednocześnie – wykorzystaniem bardziej wyrafinowanych mechanizmów analitycznych, ii) S-COLD (Selective and Comprehensive Open Linked Data), czyli BOLD 2.0. Typowe dla tego etapu ma być stosowanie rygorystycznych procedur filtrowania i łączenia tylko wybranych danych, iii) I-TOLD (Integrated and Targeted Open Linked Data), czyli BOLD 3.0, bazujące na zintegrowanych platformach danych i aglomeracji optymalnych, a jednocześnie przystępnych technologii, pozwalających na osiąganie wytyczonych celów. W tej dojrzałej wersji, architektura wymagana do wykonywania procesów analitycznych dostępna byłaby na zasadach open source i możliwa do adaptacji przy realizacji konkretnych celów w sektorze publicznym. Podkreślono, że wraz ze wzrostem złożoności i zakresu agregowanych zestawów danych, rosła będzie liczba wyzwań związanych z ich przetwarzaniem i wykorzystywaniem, istotne jest więc by organizacje akademickie i biblioteczne potrafiły przyciągnąć ekspertów w zakresie analityki BOLD, świadomych praktycznych implikacji związanych z rozwojem tej technologii.

Komentarze wyłączone.

Share

Copy short link