Analiza międzynarodowego sondażu skierowanego do realizatorów projektów Linked Data
,Kategorie: Opracowanie informacji
Tagi: Sieć 3.0, Sieć Semantyczna, biblioteki cyfrowe, linked data, metadane, współpraca
Możliwość komentowania Analiza międzynarodowego sondażu skierowanego do realizatorów projektów Linked Data została wyłączona
Badanie The International Linked Data Survey for Implementers zostało przeprowadzone przez OCLC w 2014 i 2015 r., aby zebrać dane na temat już wdrożonych lub wdrażanych projektów i serwisów, w których metadane formatowane są zgodnie z założeniami modelu Linked Data i / lub dalej wykorzystywane w ten sposób. Jego autorom udało się zebrać odpowiedzi od 90 instytucji z 20 krajów. W dokonanej w artykule analizie wyników tego sondażu uwzględniono ankiety z 2015 r., z informacjami na temat 112 eksperymentalnych projektów poświęconych publikacji danych powiązanych oraz ich konsumpcji. Autorka omówiła w nim charakterystykę respondentów, specyfikę podejmowanych przez nich inicjatyw, powody wdrażania Linked Data, typy produkowanych i używanych przez respondentów danych oraz bariery napotykane w trakcie realizacji referowanych zadań; przedstawiła także przykłady projektów implementowanych w różnego typu instytucjach.
Ogółem, na ankietę odpowiedziało w 2015 r. 71 instytucji, z których większość to placówki ze Stanów Zjednoczonych (39), a następnie z Hiszpanii (10), Wielkiej Brytanii (9), Norwegii (4) i Kanady (3). Po dwie odpowiedzi uzyskano z Australii, Francji, Niemiec, Szwajcarii i Włoch, a po jednej z Austrii, Czech, Węgier, Irlandii, Japonii, Malezji, Singapuru i Szwecji. 20% próby stanowiły biblioteki narodowe, 31% – akademickie, wśród pozostałych respondentów znalazły się międzynarodowe sieci (14%), agencje rządowe (10%), projekty szkolne (7%), biblioteki publiczne (6%), muzea, stowarzyszenia (po 4%) i jeden wydawca. Jednostki te prowadziły łącznie 168 projektów Linked Data, z których szczegółowo opisano 112. Większość z tych inicjatyw (69%) była realizowana we współpracy z zewnętrznymi partnerami (uczelniami wyższymi, instytutami badawczymi, innymi bibliotekami, stowarzyszeniami, fundacjami, zewnętrznymi konsultantami lub programistami, dostawcami oprogramowania lub innymi członkami konsorcjum) bądź też w ramach regionalnych lub krajowych programów. Prawie wszystkie zaangażowane w nie instytucje dodały pracę z Linked Data do zakresu obowiązków swoich pracowników.
Większość referowanych projektów znajdowała się we wczesnej lub wstępnej fazie rozwoju i związana była zarówno z publikacją, jak i wykorzystywaniem Linked Data, tylko 10 – wyłącznie z ich produkcją. Najpopularniejszym typem upowszechnianych danych były, ze względu na dużą reprezentację bibliotek w próbie, dane bibliograficzne i wzorcowe (odpowiednio 56 i 45 odpowiedzi), oraz opisowe (43). Wśród innych kategorii wymieniano m.in. ontologie / słowniki (30), cyfrowe kolekcje (26), dane geograficzne (18), zbiory danych (16) i dane obiektach muzealnych (10). Jako główne czynniki motywujące do publikowania Linked Data wymieniano możliwość ich prezentacji szerszej publiczności w sieci www (91%), demonstrowanie co można robić z lokalnymi zbiorami danych w postaci Linked Data (80%), chęć wypróbowania tego mechanizmu przez udostępnianie niektórych lokalnych danych w formie powiązanej (58%) bądź też sprawdzenia czy krok ten poprawi pozycjonowanie (SEO) lokalnych zasobów w wynikach wyszukiwania. Inne podawane powody związane były m.in. z czynnikami edukacyjnymi, potrzebą zapewnienia możliwości ponownego wykorzystywania danych w przyszłych projektach, maksymalizacji ich współoperatywności i opcji ponownego używania oraz testowaniem BIBFRAME i schema.org.
Najpopularniejszymi zbiorami i serwisami Linked Data (ponad 100 tys. wejść dziennie) rozwijanymi przez respondentów okazały się: Europeana, The Getty Vocabularies i Linked Data Service Biblioteki Kongresu, z ponad 50 słownikami. Najchętniej wykorzystywane źródła Linked Data (w ponad 12 projektach) to VIAF, DBpedia, Geonames i id.loc.gov. Ponieważ większość omawianych inicjatyw jest względnie nowa, tylko kilku badanych było przygotowanych do ich pełniej ewaluacji, a 46 projektów uznano wstępnie za udane, lub w większości udane. Wg autorki, zebrane odpowiedzi pozwoliły na pobieżną ocenę stanu rozwoju środowiska Linked Data oraz wykorzystywanych w nim technologii i ontologii, a także na zebranie wskazówek przydatnych innym instytucjom rozważającym rozpoczęcie eksperymentowania z aplikacjami wykorzystującymi zalety integracji zbiorów danych z różnych dziedzin i różnych źródeł.