Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Eksploracja tekstu i danych: wprowadzenie dla bibliotekarzy

Autor: Małgorzata Waleszko,

Kategorie: Technologia informacyjna i bibliotekarska, Branża, zawód i edukacja

Tagi: , , , , , , ,

Zostaw komentarz

  • Facebook
  • Wykop
  • Twitter
  • Gwar
  • StumbleUpon
  • Email

Przy rozwiązywaniu innowacyjnych problemów badawczych naukowcy coraz chętniej sięgają po techniki eksploracji danych i tekstu (ang. text and data mining – TDM), umożliwiające identyfikację trendów i relacji występujących w złożonych zbiorach danych. Międzynarodowe Stowarzyszenie Wydawców Naukowych, Technicznych i Medycznych (International Association of Scientific, Technical and Medical Publishers) definiuje TDM jako „eksploracyjną analizę danych w drodze zautomatyzowanych, obliczeniowych i lingwistycznych procesów i procedur”, a podejście to można podzielić, ze względu na format badanej informacji, na text mining, czyli na zautomatyzowane przetwarzanie cyfrowego tekstu strukturalnego oraz data mining – komputerową analizę informacji innych niż tekstowe. Aby móc wspierać nowe rozwiązania w zakresie komunikacji naukowej i praktyk badawczych, bibliotekarze i wydawcy muszą poszerzać wiedzę na temat narzędzi TDM, śledzić zmiany zachodzące szybko w tej dziedzinie, utrzymywać współpracę z analitykami oraz odnosić się do wyzwań związanych z zapewnianiem dostępu do dużych zbiorów danych. Artykuł zawiera podsumowanie sesji NASIG (North American Serials Interest Group), poświęconej wymianie doświadczeń między bibliotekarzami dziedzinowymi, pracownikami działów gromadzenia i przedstawicielami, w zakresie świadczenia usług związanych z TDM.

W jej ramach zaprezentowano podstawowe informacje dotyczące TDM oraz definicje i przykłady projektów tego typu. Omówiono również dostępne aplikacje, takie jak Wordle czy Voyant, umożliwiające tworzenie chmur słów pokazujących częstotliwość występowania danych zwrotów w pojedynczych dokumentach, bądź dużych korpusach tekstowych, oraz strony wykorzystujące mapy pojęć do prezentacji różnego typu relacji. Analizowano także rolę bibliotekarzy dziedzinowych w rozpowszechnianiu wiedzy na temat dostępnych technik analitycznych i przydatnych źródeł informacji oraz politykę wydawców i dostawców związaną z udostępnianiem swoich baz na potrzeby TDM i udzielaniem zezwoleń na pozyskiwanie zbiorów danych. Wśród kolejnych dyskutowanych zagadnień znalazły się m.in. kwestie ekstrakcji danych od różnych dostawców, licencji TDM, lokalnego przechowywania zbiorów danych, regulacji odnoszących się do wykorzystywania technik TDM przez studentów kierunków licencjackich i modeli wspierania prowadzonych na dużą skalę badań przy użyciu omawianych technik.

 

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>