Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Linked Open Data a systemy rekomendacyjne oparte na grafach

Autor: Małgorzata Waleszko,

Kategorie: Źródła informacji, Opracowanie informacji, Technologia informacyjna i bibliotekarska

Tagi: , , , ,

Zostaw komentarz

  • Facebook
  • Wykop
  • Twitter
  • Gwar
  • StumbleUpon
  • Email

Dzięki popularyzacji inicjatyw Linked Open Data, coraz większa liczba czytelnej maszynowo wiedzy zapisanej w formie wyrażeń RDF jest dostępna w tzw. chmurze LOD. Prowadzi się w związku z tym wiele badań mających na celu sprawdzenie, w jakim zakresie informacje w tej postaci mogą posłużyć do rozwoju nowych usług opartych na wiedzy lub też do poprawy efektywności platform bazujących na intensywnym wykorzystywaniu wiedzy specjalistycznej (ang. knowledge-intensive platforms), takich jak systemy rekomendacyjne (SR). W artykule omówiono specyfikę SR korzystających z reprezentacji LOD, podstawowe techniki analizy czynnikowej i metody odkrywania zależności w danych oraz podstawy rekomendacji opartych na modelu grafów, a następnie przeanalizowano wpływ integracji wiedzy egzogenicznej (ang. exogenous konwledge), pochodzącej z chmury LOD na ogólną wydajność algorytmu SR opartego na grafach. Zaproponowano również metodę automatycznego wzbogacania systemu tego typu przez wybór zestawów atrybutów pochodzących z chmury LOD i omówiono oddziaływanie kilku rozpowszechnionych technik doboru zmiennych w takim środowisku rekomendacyjnym.

W ramach badania dokonano także eksperymentalnej ewaluacji przyjętej metodologii na trzech aktualnych zbiorach danych: MovieLens 1M (zbiór rekomendacji filmowych), DBBook (rekomendacje książkowe) i Last.fm (rekomendacje muzyczne). Ustalono na jej podstawie m.in., że informacje ekstrahowane z chmury LOD mogą znacząco poprawić działanie SR opartych na grafach, efektywność algorytmów zależy jednak bezpośrednio od wyboru parametrów modelu. W eksperymentach wykazano również wyraźną korelację między wyborem techniki selekcji cech i zdolnością algorytmu do maksymalizacji określonych wskaźników oceny, takich jak dokładność lub zróżnicowanie rekomendacji, i na tej podstawie przedstawiono zalecenia dotyczące wyboru technik zgodnie z potrzebami określonych scenariuszy rekomendacyjnych. Okazało się także, że wykorzystanie algorytmu wzbogaconego o dane pobrane z LOD było efektywniejszy niż stosowanie technik niekorzystających z danych z LOD, takich jak metoda collaborative filtering czy faktoryzacja macierzy.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>