Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Tag: eksploracja tekstu

Eksploracja tekstu i danych: wprowadzenie dla bibliotekarzy

Autor: Małgorzata Waleszko,

Kategorie: Technologia informacyjna i bibliotekarska, Branża, zawód i edukacja

Tagi: , , , , , , ,

Zostaw komentarz

Przy rozwiązywaniu innowacyjnych problemów badawczych naukowcy coraz chętniej sięgają po techniki eksploracji danych i tekstu (ang. text and data mining – TDM), umożliwiające identyfikację trendów i relacji występujących w złożonych zbiorach danych. Międzynarodowe Stowarzyszenie Wydawców Naukowych, Technicznych i Medycznych (International Association of Scientific, Technical and Medical Publishers) definiuje TDM jako „eksploracyjną analizę danych w drodze zautomatyzowanych, obliczeniowych i lingwistycznych procesów i procedur”, a podejście to można podzielić, ze względu na format badanej informacji, na text mining, czyli na zautomatyzowane przetwarzanie cyfrowego tekstu strukturalnego oraz data mining – komputerową analizę informacji innych niż tekstowe. Aby móc wspierać nowe rozwiązania w zakresie komunikacji naukowej i praktyk badawczych, bibliotekarze i wydawcy muszą poszerzać wiedzę na temat narzędzi TDM, śledzić zmiany zachodzące szybko w tej dziedzinie, utrzymywać współpracę z analitykami oraz odnosić się do wyzwań związanych z zapewnianiem dostępu do dużych zbiorów danych. Artykuł zawiera podsumowanie sesji NASIG (North American Serials Interest Group), poświęconej wymianie doświadczeń między bibliotekarzami dziedzinowymi, pracownikami działów gromadzenia i przedstawicielami, w zakresie świadczenia usług związanych z TDM.

więcej o Eksploracja tekstu i danych: wprowadzenie dla bibliotekarzy

Testowanie automatycznego mapowania tagów użytkowników do pojęć Wikipedii

Autor: Małgorzata Waleszko,

Kategorie: Opracowanie informacji, Technologia informacyjna i bibliotekarska

Tagi: , , , , , , ,

Zostaw komentarz

Społeczne tagowanie stało się w ostatnich latach popularnym podejściem to tworzenia metadanych, umożliwiających wyszukiwanie wg kryterium przedmiotowego szerokiego zakresu materiałów online – fotografii (np. w serwisie Flickr), wideo (np. Vimeo), książek (np. LibraryThing), czy prac naukowych (np. CiteULike). Jako alternatywa dla opisu rzeczowego wykonywanego przez zawodowych katalogerów, z wykorzystaniem słowników kontrolowanych, indeksowanie na zasadach crowdsourcingu bazuje na społecznościach użytkowników wspólnie klasyfikujących interesujące ich zasoby, przy pomocy dowolnie dobranych słów kluczowych (folksonomii). Ze względu na swój niekontrolowany charakter, system nadawania znaczników przez internautów ma wiele ograniczeń, w tym niespójności związanych z różnicami w pisowni, synonimami, akronimami czy hiponimami. Niekonsekwencje te powodują z kolei dalsze problemy w wykorzystywaniu folksonomii, takie jak fenomen eksplozji tagów. Przyporządkowywanie tagów użytkowników do odpowiadających im haseł Wikipedii, traktowanej w tym kontekście jako słownik kontrolowany, może wg autorów zapewniać wiele korzyści w procesie generowania i organizacji metadanych, na różnych poziomach i w różnych wirtualnych środowiskach.

więcej o Testowanie automatycznego mapowania tagów użytkowników do pojęć Wikipedii