Otwarte webinaria: wprowadzenie do danych dziedzictwa

Już 27 stycznia startuje seria webinariów poświęcona danym dziedzictwa. Pokażemy, że zbiory cyfrowe to nie tylko skany, ale też metadane, warstwy tekstowe i dane wyliczane z obrazów. 3 lutego porozmawiamy o podstawach projektowania, wytwarzania i wykorzystywania danych oraz o tym, dlaczego nie istnieje coś takiego jak "dane surowe”. Cykl zamknie 17 lutego spotkanie o zastosowaniach "sztucznej inteligencji" w pracy ze zdigitalizowanymi zbiorami, od analizy tekstów po narzędzia generatywne i tworzenie wizualizacji. Webinaria organizowane są przez Fundację Kórnicką, wspierającą bloga od pierwszych miesięcy jego istnienia.
Wsparcie założonej jeszcze w 1925 roku Fundacji Zakłady Kórnickie, opiekunki Zamku w Kórniku i jego wspaniałych zbiorów, a współcześnie też wydawcy portalu historycznego Hrabia Tytus, pozwalało na utrzymywanie i rozwijanie naszego bloga już w pierwszych miesiącach jego istnienia, jeszcze zanim do projektu dołączył Jacek Mańko i zdecydowaliśmy się pojawić na Patronite. Fundacja zaufała mi w krytycznym momencie dla rozwoju tej oddolnej i niezależnej inicjatywy, za co bardzo serdecznie dziękuję.
Zachęcam wszystkich do odwiedzenia portalu Hrabia Tytus. Jego nazwa nawiązuje do postaci hrabiego Tytusa Działyńskiego, 1796–1861, założyciela Biblioteki Kórnickiej, osoby, dzięki której do dziś zachowały się tysiące książek, rękopisów i artefaktów, dokumentujących historię Polski.
Na portalu poczytacie m.in. o kontekście wypracowania Doktryny Monroe, do której swoją polityką zagraniczną wraca dziś Donald Trump, o postaci Juana Posadasa, amerykańskim zwolenniku komunizmu i wojny nuklearnej (a także źródle specyficznego gatunku memów) oraz moje teksty o potencjale "sztucznej inteligencji" w zadaniach OCR czy negatywnych reakcjach amerykańskich archiwistów na perspektywę pracy z AI od Google. Będzie tych tekstów więcej i będę informował o nich na naszym profilu na Facebooku.
W ramach współpracy z Fundacją chcemy zaprosić wszystkich czytelników i czytelniczki na cykl otwartych webinariów, których tematem będą dane kultury i dziedzictwa.
Spotkania otwarte są dla wszystkich, także dla osób bez kryzysu doświadczenia programistycznego, ale otwartych na eksperymentowanie nawet z nieco zaawansowanymi narzędziami cyfrowymi. Cykl trzech wykładów to podstawowe wprowadzenie do definiowania, pozyskiwania (czy też produkowania), analizowania i wizualizowania danych kultury i dziedzictwa. Od dekady mówi się o polityce collections as data (DOI: 10.5281/zenodo.3066237, 2024), w ramach której wartości i potencjału zbiorów bibliotek, archiwów, muzeów i galerii sztuki szuka się nie tylko w ich dostępności jako zdigitalizowanych wizerunków, ale także jako zestawów metadanych i zupełnie nowych danych, wypracowywanych na podstawie tych wizerunków i metadanych.
Wszystkie spotkania odbędą się na profilu facebookowym Hrabia Tytus. Link do wydarzenia znajduje się tutaj.
Dziedzictwo jako dane 27.01, 18:00
Dostępne w internecie zbiory dziedzictwa to nie tylko cyfrowe wizerunki, powstałe dzięki projektom digitalizacyjnym różnych instytucji. To także metadane, czyli publikowane w określonym standardzie informacje o poszczególnych artefaktach. To również, co wydaje się już mniej intuicyjne, dane budowane na podstawie zdigitalizowanych artefaktów: palety kolorystyczne wyliczane ze skanów, zestawienia obiektów widocznych na zdjęciach, warstwy tekstowe (OCR) i w konsekwencji dane korpusowe itp. Podczas wykładu dowiemy się, jak duży potencjał mają dane dziedzictwa, do czego można je wykorzystać i jak mogą zmienić nasze postrzeganie przeszłości. Do tego zobaczymy, jak ważna jest standaryzacja i gwarantowanie wszystkim odpowiednich praw do korzystania z danych dziedzictwa.
Podstawy pracy z danymi dziedzictwa 03.02, 18:00
W ramach wykładu poznamy podstawy pracy z danymi dziedzictwa: ich projektowanie, wytwarzanie, udostępnianie i wykorzystywanie. Zobaczymy, że żadne dane nie są surowe (There's no such thing as raw data) i mogą cechować się dużą stronniczością. Zobaczymy też, że do budowania danych dziedzictwa nie trzeba kompetencji programistycznych - chociaż te bardzo się przydają w takiej pracy.
"Sztuczna inteligencja" w pracy ze zbiorami dziedzictwa 17.02, 18:00
W ramach wykładu poznamy niektóre możliwości, jakie dają narzędzia "sztucznej inteligencji" w zakresie pracy ze zdigitalizowanymi zbiorami dziedzictwa. Narzędzia językowe pozwalają opisywać duże zbiory OCR-owanych skanów, budować korpusy i analizować treści za pomocą "czytania zdystansowanego", metody przetwarzania wizualnego pozwalają na dokładniejsze opisywanie materiałów wizualnych, a generatywne AI (takie jak Chat GPT czy Google Gemini) ułatwiają pozyskiwanie danych dziedzictwa i ich wizualizację.
Zapraszam serdecznie i do zobaczenia 🤓!
Marcin Wilkowski
