Nichesourcing : nowa forma współpracy naukowo-badawczej w Bibliotece Narodowej Finlandii
,Kategorie: Technologia informacyjna i bibliotekarska, Biblioteki jako kolekcje, Zarządzanie, Działalność biblioteki, Dostęp do publikacji
Tagi: Finlandia, biblioteki narodowe, digitalizacja zbiorów, języki uralskie, lingwistyka, open access, open source, oprogramowanie o otwartym kodzie źrodłowym, otwarty dostęp do publikacji, współpraca
Biblioteka Narodowa Finlandii (BNF) prowadzi od 2012 r. Projekt Digitalizacji Języków Pokrewnych (Digitisation Project of Kindred Languages), którego celem jest przeniesienie na formę cyfrową i opublikowanie online w wolnym dostępie, na otwartej platformie DSpace, ok. 1200 książek i ponad 100 tytułów czasopism w różnych, w tym zagrożonych językach z rodziny uralskiej. Powstała w jego ramach kolekcja ugrofińska (Fenno-Ugrica) zawiera obecnie ponad 110 tys. stron książek i ok. 90 tys. stron czasopism dostępnych dla wszystkich zainteresowanych, niezależnie od ich miejsca pobytu. Projekt jest wspierany finansowo przez Fundację Kone i stanowi część jej programu językowego koncentrującego się na dokumentacji rzadkich języków ugrofińskich, fińskiego i języków mniejszości narodowych Finlandii. Docelowo, udostępnione materiały mają stanowić największy na świecie zasób w językach uralskich. NBF chce również zapewnić użytkownikom Fenno-Ugrica narzędzia umożliwiające prowadzenie badań lingwistycznych, interaktywne wykorzystanie zdigitalizowanych zbiorów i wspieranie nauki obywatelskiej (ang. citizen science), wykorzystując w tym celu społecznościowe innowacje i nowe formy partnerstwa.
Aby poprawić użyteczność surowych danych i usprawnić poprawę błędów oprogramowania OCR, BNF opracowała edytor OCR o otwartym kodzie źródłowym, ułatwiający redakcję maszynowo kodowanego tekstu na potrzeby badań lingwistycznych. Filtrowanie cyfrowych treści do celów badawczych (większość to publikacje wydane w latach 20. i 30. ubiegłego wieku, w okresie zmian norm ortograficznych i wprowadzania nowych pojęć i koncepcji) byłoby jednak zadaniem przekraczającym możliwości biblioteki, zdecydowano się więc na szukanie pomocy u użytkowników. Tradycyjne metody crowdsourcingu okazały się w przypadku tego projektu mało przydatne, m.in. z tego względu, że zaplanowane prace wymagały zaawansowanej, specjalistycznej wiedzy. Nichesourcing to specyficzny typ posiłkowania się mądrością tłumu, w którym zadania rozdysponowuje się nie w społeczności anonimowych użytkowników Internetu, lecz w małych, „niszowych” grupach specjalistów, które mogą czerpać z ich ukończenia wymierne korzyści, i jednocześnie działać altruistycznie dla dobra ogółu. W przypadku projektu BNF, zadania te polegały m.in. na korekcie, przy użyciu edytora OCR, i gromadzeniu słów z określonych, wymagających uzupełnienia luk dziedzin (np. pojęć anatomicznych w języku górnomaryjskim, czy poprawionych słów w języku ingryjskim dodawanych do dostępnego publicznie słownika online), a celem nawiązanej współpracy stała się ochrona zagrożonych języków, zachowanie językowej różnorodności i służenie nauce oraz społeczeństwu.