Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Linked Open Data a systemy rekomendacyjne oparte na grafach

Autor: Małgorzata Waleszko,

Kategorie: Źródła informacji, Opracowanie informacji, Technologia informacyjna i bibliotekarska

Tagi: , , , , ,

Możliwość komentowania Linked Open Data a systemy rekomendacyjne oparte na grafach została wyłączona

Dzięki popularyzacji inicjatyw Linked Open Data (LOD), coraz większa liczba czytelnej maszynowo wiedzy, zapisanej w formie wyrażeń RDF, jest dostępna w tzw. chmurze LOD. Prowadzi się w związku z tym wiele badań mających na celu sprawdzenie, w jakim zakresie informacje w tej postaci mogą posłużyć do rozwoju nowych usług opartych na wiedzy lub też do poprawy efektywności platform bazujących na intensywnym wykorzystywaniu wiedzy specjalistycznej (ang. knowledge-intensive platforms), takich jak systemy rekomendacyjne (SR). W artykule omówiono specyfikę SR korzystających z reprezentacji LOD, podstawowe techniki analizy czynnikowej i metody odkrywania zależności w danych oraz podstawy rekomendacji opartych na modelu grafów. Następnie przeanalizowano wpływ integracji wiedzy egzogenicznej (ang. exogenous konwledge), pochodzącej z chmury LOD na ogólną wydajność algorytmu SR opartego na grafach. Zaproponowano również metodę automatycznego wzbogacania systemu tego typu przez wybór zestawów atrybutów pochodzących z chmury LOD i omówiono oddziaływanie kilku rozpowszechnionych technik doboru zmiennych w takim środowisku rekomendacyjnym.

W ramach badania dokonano także eksperymentalnej ewaluacji przyjętej metodologii na trzech aktualnych zbiorach danych: MovieLens 1M (zbiór rekomendacji filmowych), DBBook (rekomendacje książkowe) i Last.fm (rekomendacje muzyczne). Ustalono na jej podstawie m.in., że informacje ekstrahowane z chmury LOD mogą znacząco poprawić działanie SR opartych na grafach, efektywność algorytmów zależy jednak bezpośrednio od wyboru parametrów modelu. W eksperymentach wykazano również wyraźną korelację między wyborem techniki selekcji cech i zdolnością algorytmu do maksymalizacji określonych wskaźników oceny, takich jak dokładność lub zróżnicowanie rekomendacji. Na tej podstawie przedstawiono zalecenia dotyczące wyboru technik zgodnie z potrzebami określonych scenariuszy rekomendacyjnych. Okazało się także, że wykorzystanie algorytmu wzbogaconego o dane pobrane z LOD było efektywniejsze niż stosowanie technik niewykorzystujących danych z LOD, takich jak metoda collaborative filtering czy faktoryzacja macierzy.

Komentarze wyłączone.