Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Uczenie się na błędach: o znikających stronach www i projekcie Gone Dark

Autor: Małgorzata Waleszko,

Kategorie: Wykorzystanie informacji i socjologia informacji, Źródła informacji

Tagi: , , , , ,

Możliwość komentowania Uczenie się na błędach: o znikających stronach www i projekcie Gone Dark została wyłączona

Gone Dark Project to wspólna inicjatywa Instytutu Antropologii Społecznej i Kulturowej oraz Oksfordzkiego Instytutu Internetu (Uniwersytet w Oksfordzie), przeprowadzona w 2014 r. Jej celem było znalezienie dowodów potwierdzających raporty o „znikaniu” lub usuwaniu stron internetowych (dotyczące adresów URL generujących komunikaty o błędzie „404 not found”, czyli odwołujących do nieistniejącej lokalizacji) i zbadanie historii oraz losów unikalnych i wartościowych zasobów, które nie są już dostępne online i nie zostały zachowane przez Internet Archive i podobne serwisy (np. Biblioteki Kongresu czy Biblioteki Brytyjskiej) archiwizujące zawartość sieci www. W artykule zaprezentowano przesłanki, intencje i zakres tego projektu oraz przyjętą w badaniu metodologię, a następnie skoncentrowano się na analizie przypadków niezwykle cennych, utraconych (lecz mających szanse na ponowne udostępnienie online) internetowych treści, ilustrujących wyzwania związane z ochroną sieciowych zasobów.

Autorów interesowało w szczególności znalezienie odpowiedzi na pytania, jak znaczący i rozpowszechniony jest problem znikania stron www i ich zawartości, z jakich względów nie archiwizuje się ważnych internetowych zasobów, jakie są mocne i słabe strony obecnej polityki archiwizacyjnej, i jakie praktyczne kroku lub zmiany praktyk cyfrowej ochrony należy ustalić by zapobiec temu zagrożeniu w przyszłości. Nieaktualizowanych i nieistniejących już stron szukano wykorzystując w kreatywny sposób filtry wyszukiwarek i serwisy takie jak Google Cache i Wayback Machine oraz (w ograniczonym zakresie) skompilowane już listy zagrożonych lub „martwych” stron, aplikacji i usług (np. DeatchWatch grupy ArchiveTeam). Przeskanowano także potencjalnie relewantne strony i katalogi stron manualnie i przy pomocy zautomatyzowanych narzędzi weryfikacji odsyłaczy, by znaleźć niedziałające linki do baz danych, repozytoriów i archiwów unikalnych treści. Zaproszono również do współpracy ekspertów dziedzinowych i naukowców i archiwistów sieci, prosząc o informacje na temat wartościowych baz danych i zasobnych w treści stron, do których nie ma już dostępu.

Na podstawie zebranych danych utworzono i scharakteryzowano typologię nieistniejących już, lecz istotnych ze względów społeczno-kulturowych stron www, zaliczając do ich głównych kategorii: 1) źródła naukowe i akademickie, 2) polityczne, 3) historyczne i kulturalne, 4) będące wynikiem pasji i pracy indywidualnych osób, nieposiadających instytucjonalnego wsparcia, 5) platformy mediów społecznościowych (blogowe, komunikacyjne itp.), które zmieniły właścicieli lub przestały być rozwijane. Jako najważniejsze przyczyny ich znikania wskazano: i) celowe lub nieintencjonalne zaniedbania (doprowadzenie do wygaśnięcia zarejestrowanej domeny, utrata lub nieaktualizowanie plików, brak odpowiednich kopii zapasowych itp.), ii) problemy techniczne (np. dysfunkcje sprzętu, wirusy, czy starzenie się platform technologicznych), iii) problemy finansowe (koszty hostowania, utrzymania serwera, personelu itp.), iv) naturalne katastrofy, v) sytuacje wysokiego ryzyka (napięcia polityczne, społeczne rewolty, kryzysy humanitarne), vi) „wojny sieciowe” czyli rywalizację między głównymi internetowymi korporacjami, której efektem są przejęcia (a następnie zamknięcia, brak rozwoju lub połączenia popularnych serwisów). Wśród przykładów mających ilustrować różne przyczyny czasowej utraty cennych internetowych zasobów (które nie są już dostępne online, ale ich zawartość jest nadal do odzyskania) znalazły się strony kwetu.net (prywatne repozytorium szarej literatury z Kenii, Ugandy i Etiopii, niedostępne online ze względów finansowych i technicznych od 2004 r.) i Europa Film Treasures (filmowe muzeum online oferujace bezpłatny dostęp do należących do dziedzictwa filmowego produkcji z najbardziej prestiżowych europejskich archiwów, zamknięte „czasowo”, również z powodów finansowych i technicznych w 2013 r.). Omówiono również zagadnienia związane z kuratelą nad treściami stron zagrożonych likwidacją (np. ze względu na opowiadanie się po określonych stronach konfliktów i zaangażowanie w kwestie ochrony praw człowieka), podkreślając m.in. potrzebę zapewnienia przez serwisy archiwizacji Internetu mechanizmów oznaczania i zgłaszania materiałów wymagających natychmiastowego zabezpieczenia oraz narzędzi pełnotekstowego przeszukiwania historycznej zawartości Internetu, a także konieczność edukowania właścicieli stron i producentów treści w zakresie znaczenia ochrony zasobów internetowych i angażowania w opracowanie najlepszych praktyk archiwizacyjnych wszystkich zainteresowanych stron (w tym bibliotek narodowych, środowiska naukowego oraz internetowych portali i organizacji).

Komentarze wyłączone.