Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Słaba widoczność instytucjonalnych repozytoriów w Google Scholar

Autor: Małgorzata Waleszko,

Kategorie: Źródła informacji, Opracowanie informacji, Technologia informacyjna i bibliotekarska, Biblioteki jako kolekcje, Dostęp do publikacji

Tagi: , , , , , , , ,

Zostaw komentarz

Przeprowadzone na Uniwersytecie Utah badania, dotyczące optymalizacji uczelnianych serwisów internetowych dla wyszukiwarek, wykazały, że 3 główne instytucjonalne repozytoria (IR) uczelni – bazy mające w założeniu gwarantować długotrwały i powszechny dostęp do publikacji akademickich, mają niskie (poniżej 0,1%) wskaźniki indeksowania w Google Scholar (GS) – wyszukiwarki stworzonej dla tego typu publikacji. W artykule omówiono możliwe przyczyny takiej sytuacji, przedstawiono też wyniki dwóch badań dotyczących IR, przeprowadzonych przez autorów w Stanach Zjednoczonych oraz trzech opracowanych przez nich pilotażowych projektów, mających zwiększyć widoczność uniwersyteckich IR w GS.

Wg autorów, słabe wyniki pozycjonowania IR w GS związane są z tym, że do opisu zasobów w większość repozytoriów wykorzystuje się format Dublin Core, niezbyt odpowiedni do precyzyjnego zapisu bibliograficznych cytowań naukowych prac akademickich i artykułów z czasopism i ich prostej identyfikacji przez systemy wyszukiwawcze (dane nt. nazwy, rocznika i numeru czasopisma oraz stron są zazwyczaj zapisywane w DC w jednym polu, roboty wyszukiwawcze mają więc problem z ich odpowiednim rozdzieleniem). GS ma natomiast dla IR własne rekomendacje i zaleca stosowanie standardów metadanych przemysłu wydawniczego (Highwire Press, Eprints, Bepress i PRISM), a tagi Dublin Core mają być używane wg tej firmy jedynie „w ostateczności”. Założono więc, że zmiana modelu metadanych w IR pozwoli na lepsze indeksowanie ich zawartości w GS.

W celu przetestowania tej hipotezy zrealizowano, z użyciem różnych metodologii wyszukiwania tytułów artykułów, 2 badania wskaźników indeksowania w GS próby IR z katalogu OpenDOAR (wybrano serwisy hostowane w Stanach Zjednoczonych, wykorzystujące następujące typy oprogramowania: DSpace, Digital Commons, EPrints, IR+, CONTENTdm, DigiToolarXiv); przy czym wskaźnik indeksowania zdefiniowano jako liczbę unikalnych adresów URL z danego repozytorium, znalezionych w indeksie wyszukwarki, podzielonych przez całkowitą liczbę URL w tej bazie. Przeprowadzono też 3 pilotażowe projekty w ramach których zmieniono metadane podzbioru prac naukowych z USpace – IR Uniwersytetu Utah, a następnie sprawdzono wyniki ich wyszukiwania w GS.

Wg danych zebranych w obu sondażach, IR korzystające ze schematów metadanych rekomendowanych przez GS i zapisywanych w postaci meta tagów w HTML, mają znacznie wyższe wskaźniki indeksowania (88-89%) niż pozostałe (38-48%). O widoczności IR decyduje też w pewnym stopniu łatwość, z jaką roboty indeksujące mogą nawigować po tych bazach. Tezy te potwierdziły wyniki 2 i 3 projektu transformacji metadanych z standardu DC na bardziej precyzyjny schemat Highwire Press (osiągnięto wskaźniki indeksowania powyżej 90%).

W podsumowaniu przedstawiono najistotniejsze zalecenia dla twórców i administratorów IR. Podkreślono też, że słaba widoczność akademickich repozytoriów może mieć negatywny wpływ na rankingi uczelni, gdyż jej skutkiem jest mała liczna cytowań autorów prac z IR. Zaznaczono, że manualna konwersja metadanych to proces trudny i żmudny. Aby pomóc w jego usprawnieniu Uniwersytet w Utah, dzięki dotacji od Institute of Museum and Library Services i we współpracy z OCLC, podjął pracę nad opracowaniem zestawu narzędzi zawierających m.in. mechanizmy automatycznej transformacji metadanych i linked data.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>