Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Proponowane wskaźniki przystępności danych w kontekście Linked Open Data

Autor: Małgorzata Waleszko,

Kategorie: Źródła informacji, Opracowanie informacji

Tagi: , , , , , ,

Możliwość komentowania Proponowane wskaźniki przystępności danych w kontekście Linked Open Data została wyłączona

Jakość danych jest pojęciem wielowymiarowym, definiowanym w literaturze przedmiotu na wiele różnych sposobów, uwzględniających z reguły albo kontekstualne aspekty informacji, albo ich cechy wewnętrzne, niezależne od użytkownika, zadań czy aplikacji, bądź też biorących pod uwagę wpływ prezentacji informacji na ich rozumienie i interpretację. Najczęściej cytowaną definicją jest ta, w której podkreśla się znaczenie użyteczności danych dla ich akceptacji lub odrzucenia przez użytkownika i uzależnia jakość informacji od ich faktycznego wykorzystania, projektu systemu informacyjnego i procesów związanych z tworzeniem danych. W artykule przybliżono różne metodologie i poziomy oceny jakości danych, podkreślając brak zgody w środowisku naukowym co do wyboru powszechnie stosowanych metryk i praktycznych instrumentów ewaluacji jakości, a następnie zajęto się omówieniem tej problematyki w kontekście technologii Sieci Semantycznej. Wskazano, że jednym z najważniejszych atrybutów w analizowanych modelach jakości Linked Open Data (LOD) jest „przystępność danych” (ang. accessibility) i zaproponowano w związku z tym nowy zestaw wskaźników jej pomiaru.

Accessibility zdefiniowano jako stopień w jakim użyteczne dla użytkownika dane są dostępne, lub możliwe do wyszukania w szybki i łatwy sposób. Aby wybrać kryteria jej ewaluacji, autorzy dokonali przeglądu subkategorii dla metryk wymiaru przystępności danych, wymienianych w literaturze przedmiotu. Następnie, wykorzystując hierarchiczną metodę GQM – Goal, Question, Metrics (pomiaru jakości ukierunkowanego na cel), ustalili główny cel badania (ocena przystępności danych powiązanych w obiekcie LOD: plikach RDF/zbiorach danych LOD). W kolejnym kroku zidentyfikowali najważniejsze kwestie istotne przy pomiarach jakości LOD, do których zaliczyli dostępność danych (ang. data availability) czyli stopień, w którym są gotowe do użycia i możliwe do uzyskania, ich wydajność (ang. data performance), czyli skalowalność, produktywność i czas reakcji w systemie do skutecznego i efektywnego przetwarzania danych, i zasady bezpieczeństwa (ang. data security policy) czyli obecność mechanizmów chronionego dostępu do danych i ich zabezpieczeń przed nieautoryzowanymi zmianami. Cztery główne pytania, jakie sformułowano zgodnie z podejściem GQM, by pomóc w zrozumieniu postawionego celu dotyczyły tego, czy dane są dostępne, jaka jest ich funkcjonalność, czy czas odpowiedzi jest adekwatny i czy mechanizmy bezpieczeństwa danych są prawidłowe. Po przeprowadzonej analizie zaproponowano 27 obiektywnych i subiektywnych metryk umożliwiających znalezienie odpowiedzi na te pytania w sposób liczbowy. W podsumowaniu zaznaczono potrzebę ich przetestowania i implementacji na faktycznych zbiorach danych w przestrzeni LOD.

Komentarze wyłączone.