Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Ewaluacja narzędzi integrujących w Sieci Semantycznej: badanie empiryczne

Autor: Małgorzata Waleszko,

Kategorie: Źródła informacji, Opracowanie informacji, Technologia informacyjna i bibliotekarska

Tagi: , , , , ,

Zostaw komentarz

Rozwój technologii Sieci Semantycznej zachęca dostawców danych do publikowania własnych treści we wzajemnie powiązanej postaci, w celu klasyfikacji i organizacji informacji w sposób bardziej użyteczny niż w tradycyjnych modelach reprezentacji wiedzy. Tworzenie wzajemnych odwołań między otwartymi zbiorami danych ułatwia też nawigację i wyszukiwanie nowych informacji, a wykorzystanie w tym celu narzędzi pozwalających na automatyczne łączenie określonych pojęć z komponentami chmury Linked Open Data (ang. interlinking tools – IT) i wyszukiwanie relacji między nimi staje się coraz bardziej powszechne. W artykule omówiono wyniki ewaluacji trzech silników IT, wykorzystanych do powiązania dużej, edukacyjnej kolekcji ze zbiorami danych LOD.

Proces łączenia testowano na zbiorze GLOBE (federacyjne repozytorium metadanych dla ok. 1 mln zasobów e-learningowych i obiektów dydaktycznych z różnych źródeł), uwzględniając 2 elementy z wykorzystywanego w nim standardu IEEE LOM: zasięg (okres, kultura, geografia lub region do którego odnosi się dany zasób) i taksonomię (termin klasyfikacyjny nadany danemu zasobowi). Jako źródło odniesienia dla terminów z taksonomii GLOBE wybrano DBpedię (ustrukturyzowaną i przetwarzalną w sposób automatyczny wersję Wikipedii w formie LOD), a dla elementów zasięgu metadanych GLOBE – z informatora The World Factbook Centralnej Agencji Wywiadowczej Stanów Zjednoczonych. Istniejące IT zbadano pod kątem zgodności z przyjętymi kryteriami, decydując się na wybór 3 aplikacji: LIMES, SilkLODRefine. Rezultaty automatycznego linkowania przy pomocy tych narzędzi przedstawiono następnie do weryfikacji grupie ekspertów.

Okazało się, że wyniki pracy silników Silk i LIMES były znacznie lepsze niż LODRefine (odpowiednio 710 i 700 (na 2342) powiązanych z DBpedią terminów w porównaniu z liczbą 291 uzyskanych przez LODRefine). Podobną skuteczność uzyskano natomiast przy łączeniu skojarzonych elementów zasięgu terytorialnego GLOBE i krajów z bazy Factbook. Większość trafień uzyskanych przez IT została zaakceptowana przez ekspertów, a na podstawie ich ewaluacji uznano wykorzystanie analizowanych narzędzi za efektywną i wiarygodną metodę tworzenia powiązań między dwoma zbiorami danych lub danym zasobem i chmurą LOD, i za podejście godne polecenia dla dostawców danych, pomocne przy semantycznym łączeniu publikowanych treści ze zbiorami w Sieci Danych (Web of Data). Stwierdzono również, że Silk wydaje się najbardziej obiecującym rozwiązaniem w odniesieniu do znajdywania największej liczby trafnych dopasowań między zestawami danych i zapewniania różnorodnych możliwości ich weryfikacji.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>