Cyfryzacja domowego archiwum: lokalne przechowywanie, metadane z AI i baza danych kontra pamięć

Setki godzin nagrań wideo mogą zostać przekształcone w przeszukiwalną bazę danych dzięki lokalnym modelom AI i z pomocą ChatGPT jako źródła niezbędnych kompetencji do przygotowania archiwum. Warto jednak zapytać, jak nieustanna dostępność już cyfrowych śladów historii rodzinnej wpływa na pamięć i wyobrażenia o przeszłości. Czy po początkowej ekscytacji odkrywaniem zapomnianych scen nie przychodzi znudzenie i zawód? "A więc tak to wyglądało? I to już wszystko?"
To chyba jeden z najciekawszych tekstów, jakie ostatnio czytałem. Postać autora nic nam nie powie - to mieszkający w Stanach deweloper i bloger Sam Patterson. Dla nas ważne jest to, że ma kompetencje w pracy z narzędziami AI i realizuje projekty wykorzystujące zdecentralizowane podejście, samodzielne niezależne hostowanie zasobów, lokalne modele LLM oraz zapewniające odpowiedni poziom prywatności.
Patterson relacjonuje na swoim blogu pracę nad dużym zbiorem taśm wideo do kamery Sony Handycam Video8, które znalazł w piwnicy swojego domu. Jego ojciec regularnie dokumentował wszystkie mniej lub bardziej ważne rodzinne wydarzenia z lat 90. tą małą, amatorską, analogową kamerą, wykorzystującą do rejestracji obrazu i dźwięku taśmy magnetyczne. Format Video8 przeznaczony był głównie pod amatorskie nagrywanie, Sony eksperymentowało także z urządzeniami mającymi umożliwiać wygodne odtwarzanie takich materiałów, proponując swego czasu nawet wideo-walkmana.
Leżące w piwnicy od lat 122 kasety czekały na digitalizację - autor i bohater tej historii chciał spojrzeć na swoje dzieciństwo z nowej perspektywy, nie chciał jednak mozolnie przeglądać nagrania za nagraniem. Projekt, który zaplanował, nie miał wyłącznie charakteru technicznego - chodziło także o pewną pracę z pamięcią:
Czy masz jakieś dobre wspomnienia z trudnych okresów swojego życia? Jeśli tak, gratulacje, jesteś bardziej łaskawy [wobec przeszłości - MW] (albo masz lepszą pamięć) niż ja. Najbardziej wyraziste są dla mnie wciąż te najgorsze momenty. Ale jeśli mamy szczęście w takim czasie, nawet, a może zwłaszcza, są wtedy wokół nas ludzie, którzy próbują zrobić dla nas coś dobrego. Z lekkim wstydem przyznaję, że zapomniałem o tych ludziach i o tych gestach, a ten pojemnik [z kasetami - MW] był ich pełen. Ogarnęło mnie wspaniałe uczucie odkrycia, jak wielu wspierających przyjaciół i członków rodziny miałem wtedy.
Znowu neoluddyzm, wsteczniactwo i walka z wiatrakami ubrane w ładne słowa. Ziew - to slogan pochodzący z jednego z komentarzy na profilu Humanistyka.dev, który umieściliśmy na naszej stronie na Patronite. Oczywiście, można nam zarzucać wiele, także to, że nie bardzo lubimy "sztuczną inteligencję". Ale tak nie jest, po prostu odrzuca nas nakładanie na te narzędzia niepotrzebnych i nieistniejących wartości. Świadomość, etyka, myślenie, kreatywność - po co to komu w zwykłej maszynie?
Zobaczmy - My Grandma Was a Fed - Lessons from Digitizing Hundreds of Hours of Childhood to historia, w której sztuczna inteligencja odgrywa niebagatelną rolę. Odgrywa ją tak, jakbyśmy tego oczekiwali - nie jest podmiotem, ale narzędziem. Autor nie chce oddać tych kaset do firmy, która miałaby je zdigitalizować - nagrań jest zbyt wiele, to miałby być zbyt duży koszt. Musi zrobić to sam, z pomocą AI. Skorzystanie z ChatGPT pozwala na konfigurację portu FireWire na Linuksie (trzeba jakoś podłączyć kamerę do komputera), pokazuje, jak zmienić konfigurację sieci, żeby szybciej przesyłać duże pliki wideo (wiele GB) na lokalny serwer, ostatecznie też pomaga w napisaniu aplikacji, która pozwala na ich bezpieczne streamowanie, bez udostępniania ich na jednej z wielkich platform “w chmurze” (to w końcu rodzinne nagrania). Praca ze wsparciem ChatGPT pozwala bohaterowi notki nie tylko udostępnić rodzinie streaming z nagrań, ale też opisać je metadanymi, dzięki czemu można je przeszukiwać. Pamiętajmy jednak, że nie jest to osoba, która wcześniej nie miała do czynienia z programowaniem - pewna bariera wejścia jest tu już dawno przekroczona. Być może w korzystaniu z AI sprawdza się efekt św. Mateusza - kto więcej wie i umie, dzięki sztucznej inteligencji będzie wiedział i umiał jeszcze więcej.
Jednak digitalizacja to nie wszystko - to jedynie wstęp do prawdziwej pracy z domowymi zbiorami. Przeglądanie może być chaotyczne, być może potrzebujemy jednak jakiejś opowieści:
Tak, to niesamowite móc przeglądać nagrania [...], oglądając różne przypadkowe sceny z dzieciństwa. Ale nie ma w tym żadnej opowieści, która mogłaby się rozwijać. Postanawiam więc zbudować oś czasu spersonalizowaną dla każdego z rodzeństwa - skoro każdy film ma metadane na temat tego, kto znajduje się na nagraniu i kiedy zostało ono zrobione, można teraz śledzić historię swojego dorastania, po prostu przewijając własną oś czasu.
Wypracowywanie metadanych dla każdej sceny było warunkiem stworzenia osi czasu - autor samodzielnie przeglądał kasety i opisywał fragmenty nagrań w plikach tekstowych w formacie YAML. Do tego wykorzystał - działający lokalnie - model whisperX od OpenAI, który pozwolił na transkrypcję dźwięku nagrań - cały proces od digitalizacji po transkrypcję opisany jest tutaj. Duże znaczenie w powodzeniu projektu miało korzystanie z ChatGPT jako źródła kompetencji niezbędnych do zbudowania infrastruktury i zaplanowania poszczególnych etapów pracy.
Poza wątkiem użycia AI interesujący jest w tej notce także wątek... zasobów sprzętowych. Nie myślimy o tym zazwyczaj, ponieważ nasze codziennie robione zdjęcia i nagrania trafiają do chmury (czyli na inne serwery, które nie są pod naszą kontrolą). Autor notki dość mocno się trudzi, żeby zbudować sobie odpowiednią infrastrukturę do przechowywania i udostępniania rodzinnych nagrań. Chce wszystko mieć u siebie.
Interesującym kontekstem całej akcji z digitalizacją nagrań rodzinnych są pytania o to, jak nowy, natychmiastowy i pełny dostęp do nagrań archiwalnych zmienić może wyobrażenia o dzieciństwie. Streaming takich nagrań to rezygnacja z fizycznej bariery, jaką były oddzielone, kiedy spokojnie leżały w plastikowym pudle i kiedy sięgnięcie do nich wymagało konkretnej pracy, poświęcenia odpowiedniej ilości czasu i posiadania specyficznych umiejętności.
Jak pisze Amelia Acker w książce Archiving Machines: From Punch Cards to Platforms (2025),
pojęcie uśpienia danych (data at rest) pojawiło się w kulturze technologicznej jeszcze przed epoką komputerów osobistych i oznaczało wykonanie kopii danych, przetwarzanych w pamięci komputerów, tak aby można je było wyłączyć z systemu dostępu i przechowywać na zewnętrznych nośnikach. Przykładowo, dane skopiowane na taśmę magnetyczną mogły być statycznie przechowywane na półce w archiwum danych, co zapewniało niezbędny fizyczny dystans (air gap) od działających systemów komputerowych. W przypadku archiwizacji w chmurze taki dystans nie istnieje, ponieważ dane te są nieustannie dostępne i przetwarzane.
Kiedy wyciągamy nagrania z archiwum i mamy do nich pełny, natychmiastowy i codzienny dostęp, nasze wyobrażenia dzieciństwa mogą się zmieniać. Niektóre rzeczy okazują się inne, niż nam się wydawało, tak. Ale też może pojawia się doświadczenie znudzenia albo nawet zawodu? A więc to tak wyglądało? Meh…. Pamięć jest efektywniejsza, potrafi kolorować, bronić nas przed przemocą przeszłości, nadawać historiom nieistniejące wartości. Bezpośredni i stały dostęp do nagrań redukuje to wszystko. Czy to dobrze? Kto wie.
Autor: redakcja
