Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Wzrost i spadek zawartości tekstu w sieci www: ilościowe badanie archiwów internetowych

Autor: Małgorzata Waleszko,

Kategorie: Źródła informacji, Technologia informacyjna i bibliotekarska

Tagi: , , , , ,

1 komentarz

  • Facebook
  • Wykop
  • Twitter
  • Gwar
  • StumbleUpon
  • Email

Cechą wspólną sieciowych platform cieszących się obecnie największą oglądalnością jest przewaga grafiki, wideo i animacji nad słowem pisanym, a na podstawie ich obserwacji oraz lektury najpopularniejszych internetowych serwisów informacyjnych, można odnieść wrażenie, że użytkownicy online coraz mniej chętnie czytają długie teksty (nowe media, takie jak BuzzFed, wyprzedzające znacznie w rankingach popularności internetowe wydania tradycyjnych gazet, ze względu na krótkie bloki tekstowe i dużą liczbę treści wizualnych, przypominają wyglądem bardziej książki dla dzieci niż gazety dla dorosłych). W artykule omówiono wyniki badania, w ramach którego szukano dowodów potwierdzających prawdziwość tych spostrzeżeń i sprawdzano, czy mogą one sygnalizować bardziej ogólny trend w kierunku redukcji tekstu w sieci www.

W celu określenia, czy i od kiedy można mówić o spadku liczby elementów tekstowych i jaka jest skala tego zjawiska, autor dokonał przeglądu piśmiennictwa poświęconego czytaniu online i zależnościom między tą formą aktywności a czytaniem jako takim, a następnie przeanalizował zawartość 600 zarchiwizowanych wersji 100 prestiżowych i popularnych amerykańskich stron internetowych z różnych sektorów (produkty konsumenckie i handel, biblioteki, administracja państwowa i samorządowa, muzea, czasopisma, gazety, usługi online, technologia, telewizja), by określić, czy zawartość prezentowanego na nich użytkownikom tekstu zmniejszyła się w ciągu ostatnich 15 lat. Listę stron opracowano na podstawie systemu Alexa – indeksu angielskojęzycznych witryn generujących największy ruch (z 500 pozycji w rankingu odrzucono te, które nie były aktywne w całym wybranym przedziale czasowym, bądź nie spełniały kryteriów tematycznych). Ich wersje do testów pobrano z Internet Archive (lata 1999, 2002, 2005, 2008, 2011 i 2014), wykorzystując algorytm wizji komputerowej (SWT – Stroke Width Transformation) do lokalizacji obszarów zawierających tekst, i określono następnie, przy użyciu oprogramowania SPSS, jego procent na każdej z badanych wersji stron i średni odsetek tekstu rocznie. Sprawdzono również, przeprowadzając jednoczynnikową analizę wariancji, czy procent tekstu na stronach zależy od roku w którym powstała dana wersja.

Ustalono, że od końca lat 90. udział procentowy tekstu na stronach wzrastał (z 22,4% w 1999 r.) osiągając największą wartość w 2005 r. (32%), a od tego czasu stale spadał – w 2014 wyniósł średnio 26,9%. W przypadku tego ostatniego roku, odsetek ten miał również najniższe standardowe odchylenie, co oznacza, że badane strony były mniej zróżnicowane w odniesieniu do proporcji tekstu i treści wizualnych, co może też sugerować rosnący konsensus w zakresie sposobów projektowania stron i zalecanych praktyk dotyczących zawartości pól tekstowych prezentowanych użytkownikom. Zaobserwowany w ciągu ostatnich 9 lat stały trend spadkowy, potwierdzony w podobnych badaniach (np. nad zawartością portugalskich witryn internetowych) może też zdaniem autora wskazywać na możliwość dalszego pogłębiania się tej tendencji. Zastanawia się on również czy, w sytuacji gdy globalna sieć będzie zapewniać coraz mniej elementów do czytania, użytkownicy zaczną korzystać w tym celu w większym stopniu z innych mediów (czytniki e-książek, książki drukowane).

Jeden komentarz

  1. Sebastian 09-01-2016 10:31

    Bardzo interesujący artykuł, zgłębiający ważną tendencję, z doskonałym materiałem badawczym. Dziękuję za jego przybliżenie!

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>