Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Ewaluacja semantycznych systemów wyszukiwania w Sieci Semantycznej

Autor: Małgorzata Waleszko,

Kategorie: Źródła informacji, Opracowanie informacji, Technologia informacyjna i bibliotekarska

Tagi: , , , ,

Zostaw komentarz

Artykuł poświęcono analizie i ewaluacji różnych typów mechanizmów wyszukiwania semantycznego w sieci www, w odniesieniu do ich możliwości organizacji i lokalizacji sieciowych dokumentów semantycznych. Na podstawie przeglądu literatury przedmiotu autorzy omawiają w nim infrastrukturę Sieci Semantycznej (SS), charakterystyki różnych typów silników wyszukiwawczych i systemów modelowania wiedzy oraz główne problemy związane z ewaluacją wyszukiwania w SS. Klasyfikują też zestaw atrybutów charakteryzujących poszczególne rozwiązania, przydatny przy ocenie zarządzania semantycznymi dokumentami. Następnie, przeprowadzają, w kontekście sieciowym, jakościową ewaluacji, wg tych kryteriów, 12 semantycznych wyszukiwarek różnego typu, wykorzystując w tym celu metodologię Desmet stosowaną w inżynierii oprogramowania.

Sieciowe dokumenty semantyczne (SDS) zdefiniowano w artykule jako połączone zasoby informacyjne złożone z identyfikowanych w unikatowy sposób, semantycznie adnotowanych i wzajemnie powiązanych jednostek danych dokumentacyjnych o różnej granularności, zaliczając do nich także słowniki metadanych, ontologie i schematy i wskazując na problematyczność definiowania SDS jedynie jako dokumentów w języku RDF, oraz ograniczania specyfikacji systemów wyszukiwawczych dla SDS do obiektów RDF. Wskazano też na niespójności SS będące m.in. wynikiem stosowania różnych podejść do reprezentacji wiedzy w sformalizowany sposób i odmienności syntaktyki i semantyki każdego modelu reprezentacji oraz problemy związane z doborem odpowiednich słowników metadanych do opisu dokumentów semantycznych. Skategoryzowano także najczęściej wymieniane w literaturze przedmiotu ograniczenia SS, związane m.in. z jakością słownictwa, jakością opisu dokumentów, preferowaniem otwartych standardów przez społeczność naukową, architekturą semantycznego linkowania, nieaktualnością części SDS, wiarygodnością, formalizacją, problemami z URI, trudnościami w formułowaniem kwerend w SPARQL, kwestiami prywatności przy integracji danych z różnych źródeł, dostosowaniem słowników i użytecznością obecnych mechanizmów wyszukiwawczych.

Zreferowano następnie różne typy wyszukiwarek semantycznych i podejścia do ich ewaluacji, a następnie scharakteryzowano szczegółowo przyjętą przez autorów metodę porównania i oceny oraz 3 kategorie użytych kryteriów, powiązanych z zarządzaniem schematem wyszukiwania, zarządzaniem semantycznym i kwerendami. W badaniu uwzględniono 4 rodzaje silników wyszukiwawczych obejmujących zasięgiem: ontologie (np. Swoogle, Sindice, Watson), metadane (Linked Open Vocabulary (LOV), DataHub), katalogi ontologii (DAML Ontology Library, Protege Ontologies) i katalogi metadanych (UKOLN metadata resource, PSI Topic Maps, Open Metadata Registry i in.). Na podstawie dokonanej dla każdej z kategorii ewaluacji stwierdzono, że bieżące techniki semantycznego wyszukiwania są obarczone wadami i nie stanowią rozwiązania dla zidentyfikowanych wyżej problemów, a ich ograniczona funkcjonalność utrudnia popularyzację wykorzystania SDS. Uznano też sposoby implementacji systemów tego typu za niespójne i wskazano na niski poziom implementacji ważnych specyfikacji dotyczących funkcjonalności badanego oprogramowania oraz kryteriów ich oceny, i oceniono, że Sieć Semantyczna, na obecnym etapie rozwoju, cechuje się niską użytecznością wynikającą z problemów z zarządzaniem dokumentami semantycznymi.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>