Uruchomienie bloga zostało sfinansowane przez społeczność ❤️
Mecenasem bloga jest Fundacja Zakłady Kórnickie,
wydawca portalu historycznego Hrabia Tytus

Czy tegoroczna kampania wyborcza w sieci nie zasłużyła na archiwizację?

Czy tegoroczna kampania wyborcza w sieci nie zasłużyła na archiwizację?

Jeśli próbujemy wyobrazić sobie to, jak za dziesięć lat będzie się badać tegoroczne wybory prezydenckie, możemy spodziewać się, że zasoby Webowe będą w nich marginalnym źródłem. Nie dlatego, że internet nie ma dużego znaczenia w całym procesie wyborczym. Po prostu nikt w Polsce internetu nie archiwizuje.

Dla sztabów kandydatów i dla mediów internet jest oczywiście źródłem danych wyborczych: gromadzi się je, analizuje, wykorzystuje do komunikowania własnego przekazu. Problem w tym, że myśli się o nich wyłącznie w odniesieniu do tu i teraz. Nikt nie widzi w nich zasobu historycznego.

"Lokalne wybory i witryny polityczne są ze względu na swoją naturę niezwykle efemeryczne, zwłaszcza jeśli dotyczą przegranych kandydatów" - piszą autorzy opracowania Web Archiving Local Election and Government Websites (2021), poświęconego wyborom do władz stanowych w Michigan. Nasze wybory prezydenckie chyba nie będą tu wyjątkiem - różnią się oczywiście skalą (maksymalnie kilkunastu kandydatów), ale wytwarzane w procesie wyborczym treści cyfrowe mogą być podobnie bogate, rozczłonkowane i efemeryczne.

O ile w przypadku witryn kandydatów (nie wiem, czy ktokolwiek jeszcze ich szuka i z nich korzysta), możem liczyć na przypadkową archiwizację w Wayback Machine, to taki nieformalny outsourcing amerykańskiej fundacji dla polskiego państwa będzie zupełnie nieskuteczny przy mniej oczywistych zasobach, z którymi mamy dwa podstawowe problemy: są bardzo rozproszone i jest ich bardzo dużo.

Autorzy przywołanego opracowania zorganizowali grupę fokusową, w ramach której dyskutowano o możliwościach i ograniczeniach archiwizacji zasobów internetowych związanych z wyborami. Wnioski, które zebrano, łatwo da się odnieść do polskich realiów. Wybory dokumentujemy i potem badamy historycznie nie tylko analizując strony czy wystąpienia kandydatów, ale

  • istotne są zasoby dokumentujące organizację głosowania, działalność komisji, informacje o uprawnionych do głosowania,
  • poza stronami kandydatów wartościowe są także witryny instytucji i organizacji, które zajmują się działalnością polityczną i strażniczą wokół wyborów (np. latarnik wyborczy edit),
  • zabezpieczanie danych z mediów społecznościowych jest fundamentalne, ponieważ media te odgrywają dziś poważną rolę w komunikacji politycznej,
  • archiwizacji podlegać powinny też komentarze z mediów społecznościowych i portali newsowych, nie tylko dlatego, że wyrażają poglądy polityczne użytkowników, ale mogą być też podstawą badań nad manipulacjami wyborczymi,
  • istotna jest głęboka archiwizacja witryn wyborczych, ponieważ znajdują się na nich także dokumenty PDF, kalendarze kampanii wyborczej, protokoły wyborcze itp.,
  • równolegle do gromadzenia i zabezpieczania tego typu zasobów należy rozwijać kompetencje w ich wykorzystaniu badawczym, np. w ramach kursów semestralnych na kierunkach takich jak politologia czy socjologia,
  • zgromadzone zasoby mogą być eksplorowane za pomocą dodatkowych narzędzi takich jak systemy korpusowe, programy do analizy języka naturalnego, tworzenia map cyfrowych itp.

Już choćby takie proste zestawienie elementów, na jakie składać się pogram archiwizacji wyborczego Webu, pokazuje, jak bardzo jesteśmy - jako państwo - spóźnieni.

Czy w Polsce archiwizowano kiedyś wyborczy internet? Owszem, była jedna taka próba: Biblioteka Narodowa wzięła udział w ’09 European Election Web Harvesting Project. W opracowaniu z 2012 roku Katarzyna Ślaska i Anna Wasilewska (BN) pisały tak o tym epizodzie:

Podczas etapu planowania Biblioteka Narodowa określiła kryteria selekcji stron internetowych (komitety wyborcze oraz wybrani kandydaci). Następnie przygotowano i rozesłano opracowane przez prawników listy informacyjne wraz z formularzami zgody na archiwizowanie wskazanych przez adresatów stron internetowych.
Przygotowano także stronę techniczną procesu archiwizacji — sprzęt oraz oprogramowanie. Do realizacji projektu wykorzystano program Heritrix dostarczony przez IIPC [International Internet Preservation Consortium].

Podczas archiwizowania zgromadzono listę adresów URL stron WWW. W ostatnim etapie przejrzano zgromadzony materiał oraz przeanalizowano stronę techniczną.

Efekty inicjatywy nie były imponujące - współcześnie biblioteki narodowe (nie w Polsce!) nie pytają o zgodę wydawców na archiwizowanie ich treści, traktując strony WWW jako publikacje i odwołując się do uprawnień wynikających z prawa o egzemplarzu obowiązkowym:

W Polsce w wyborach [w 2009 roku] startowało 1311 kandydatów. Biblioteka Narodowa przyjęła założenie, że zapewne nie wszyscy będą prowadzić własne strony wyborcze w Internecie, dlatego też zdecydowano się — zgodnie z przyjętymi zasadami selekcji — na wybór 219 kandydatów, którzy podczas ostatniego rankingu byli najwyżej oceniani i uzyskali ocenę 1+.

Udało się nawiązać kontakt mailowy ze 141 osobami, do których wysłano listy informacyjne zawierające klauzulę, że zarchiwizowane strony będą służyły wyłącznie celom badawczym i nie będą udostępniane publicznie.

Niestety, wpłynęło bardzo mało odpowiedzi: od kandydatów zaledwie 10, od komitetów wyborczych — 6 (na 9, do których skierowano listy).

Bardzo słaby odzew świadczy o znikomej świadomości w zakresie możliwości i konieczności archiwizowania Internetu.

Na podstawie założeń, wypracowanych w ramach konsultacji na Uniwersytecie Stanowym Michigan, przeprowadzono akcję archiwizacyjną - jej efekty zobaczyć można na stronie archive-it.org. Skorzystanie z usługi subskrypcyjnej, oferowanej przez Internet Archive, zdjęło z organizatorów konieczność samodzielnego przygotowania infrastruktury archiwizacyjnej. Dziś podobny projekt można z powodzeniem zrealizować także z wykorzystaniem oprogramowania Browsertrix.

Ciekawe szczegóły wyborczej akcji archiwizacyjnej znaleźć możemy też na witrynie archiwum Webu, prowadzonego przez Bibliotekę Narodową Luksemburga. W przypadku wyborów europejskich z 2019 roku zbiór nie jest duży - to nieco ponad 500GB, zawiera jednak nie tylko klasyczne witryny, ale też wybrane profile z mediów społecznościowych.

Celem archiwizacji Webu nigdy nie jest pełne zabezpieczenie wszystkich dostępnych zasobów. Jeśli jednak regularnie archiwizuje się jakąś jego część, powstaje w ten sposób korpus, mogący być uzupełnieniem przyszłych badań historycznych. Wiadomo przecież, że o wyborach nie da się mówić wyłącznie w odniesieniu do internetu - tak wiele rzeczy dzieje się i decyduje w tym procesie poza powierzchnią ekranów.

...

Web Archiving Local Election and Government Websites (2021), https://doi.org/10.5860/dttp.v49i3/4.7685

Archiwizacja Internetu — sytuacja w polskim prawie z punktu widzenia bibliotekarzy (2012) https://www.sbc.org.pl/dlibra/publication/edition/639504

Jeśli ten wpis okazał się dla Ciebie wartościowy, możesz dorzucić się do wsparcia bloga. Postaw wirtualną kawę na Suppi.pl

Wpis opublikowany na licencji Creative Commons Uznanie autorstwa - Na tych samych warunkach.