Ewaluacja narzędzi integrujących w Sieci Semantycznej: badanie empiryczne
,Kategorie: Źródła informacji, Opracowanie informacji, Technologia informacyjna i bibliotekarska
Tagi: Linked Open Data, Sieć 3.0, Sieć Semantyczna, interlinking, oprogramowanie, systemy organizacji wiedzy
Możliwość komentowania Ewaluacja narzędzi integrujących w Sieci Semantycznej: badanie empiryczne została wyłączona
Rozwój technologii Sieci Semantycznej zachęca dostawców danych do publikowania własnych treści we wzajemnie powiązanej postaci, w celu klasyfikacji i organizacji informacji w sposób bardziej użyteczny niż w tradycyjnych modelach reprezentacji wiedzy. Tworzenie wzajemnych odwołań między otwartymi zbiorami danych ułatwia też nawigację i wyszukiwanie nowych informacji, a wykorzystanie w tym celu narzędzi pozwalających na automatyczne łączenie określonych pojęć z komponentami chmury Linked Open Data (ang. interlinking tools – IT) i wyszukiwanie relacji między nimi staje się coraz bardziej powszechne. W artykule omówiono wyniki ewaluacji trzech silników IT, wykorzystanych do powiązania dużej, edukacyjnej kolekcji ze zbiorami danych LOD.
Proces łączenia testowano na zbiorze GLOBE (federacyjne repozytorium metadanych dla ok. 1 mln zasobów e-learningowych i obiektów dydaktycznych z różnych źródeł), uwzględniając 2 elementy z wykorzystywanego w nim standardu IEEE LOM: zasięg (okres, kultura, geografia lub region do którego odnosi się dany zasób) i taksonomię (termin klasyfikacyjny nadany danemu zasobowi). Jako źródło odniesienia dla terminów z taksonomii GLOBE wybrano DBpedię (ustrukturyzowaną i przetwarzalną w sposób automatyczny wersję Wikipedii w formie LOD), a dla elementów zasięgu metadanych GLOBE – z informatora The World Factbook Centralnej Agencji Wywiadowczej Stanów Zjednoczonych. Istniejące IT zbadano pod kątem zgodności z przyjętymi kryteriami, decydując się na wybór 3 aplikacji: LIMES, Silk i LODRefine. Rezultaty automatycznego linkowania przy pomocy tych narzędzi przedstawiono następnie do weryfikacji grupie ekspertów.
Okazało się, że wyniki pracy silników Silk i LIMES były znacznie lepsze niż LODRefine (odpowiednio 710 i 700 (na 2342) powiązanych z DBpedią terminów w porównaniu z liczbą 291 uzyskanych przez LODRefine). Podobną skuteczność uzyskano natomiast przy łączeniu skojarzonych elementów zasięgu terytorialnego GLOBE i krajów z bazy Factbook. Większość trafień uzyskanych przez IT została zaakceptowana przez ekspertów, a na podstawie ich ewaluacji uznano wykorzystanie analizowanych narzędzi za efektywną i wiarygodną metodę tworzenia powiązań między dwoma zbiorami danych lub danym zasobem i chmurą LOD, i za podejście godne polecenia dla dostawców danych, pomocne przy semantycznym łączeniu publikowanych treści ze zbiorami w Sieci Danych (Web of Data). Stwierdzono również, że Silk wydaje się najbardziej obiecującym rozwiązaniem w odniesieniu do znajdywania największej liczby trafnych dopasowań między zestawami danych i zapewniania różnorodnych możliwości ich weryfikacji.