ChatGPT i Google AI Overviews korzystają z Wikipedii jako jednego z głównych źródeł wiedzy, Reddit i Wikipedia mogą stać się celem ataków typu WARP (Web Agent Retrieval Poisoning) a ustrukturyzowane opisy z Wikimedia Commons pozwalają na budowanie modeli wykonujących zadania Visual Question Answering (VQA) - na przykład rozpoznawanie zabytków albo potraw kuchni świata. To tematy prac naukowych, opisane w ostatnim zestawieniu z cyklu....
Czytaj dalej
Każdego miesiąca na platformie ebookowej Amazona publikowanych jest około 300 tys. nowych tytułów, wygenerowane opowiadania mają otrzymywać nagrody literackie, a noblistka przyznaje się do korzystania z jednego z modeli językowych w pracy nad kolejną książką. Zmienia się rynek książki, ale czy zmienia twórczość i literatura?...
Czytaj dalej
Analiza na reprezentatywnym zbiorze 50 tys. anglojęzycznych ebooków z oferty Amazona ujawniła, że w 2025 roku ponad 60 proc. z nich tworzonych / generowanych było z wykorzystaniem dużych modeli językowych. Chociaż dzięki "AI" rośnie liczba nowych książek, ich jakość spada, a publikacje identyfikowane jako (współ)tworzone maszynowo przyciągają znacznie mniej czytelników i mają niższe oceny niż książki napisane przez ludzi....
Czytaj dalej
Czy duże modele językowe mogą służyć jako generatory treści reprezentujących kultury, społeczności i okresy historyczne, dla których nie mamy dużych zbiorów oryginalnych źródeł, i to dzięki umiejętnemu wykorzystaniu ich ograniczeń?...
Czytaj dalej
W pierwszej naszej audycji rozmawiamy o tym, jak Richard Dawkins odkrył świadomość w Claude. Wspominamy memetykę i biologiczne / technologiczne interpretacje kultury i społeczeństwa. Zauważamy, że łatwiej jest szukać świadomości w "AI", która posługuje się językiem naturalnym niż takiej, która gra w szachy albo składa białka. Narzekamy na spłaszczanie problemów badanych w naukach humanistycznych i społecznych przez fanów "nowych technologii"....
Czytaj dalej
Duże modele językowe trenowane są na współczesnych danych, dlatego “wiedza” zamknięta w wagach i prawdopodobieństwach kolejnych tokenów może być w miarę aktualna. Istnieje jednak kategoria modeli, w których data odcięcia wiedzy przesuwana jest głęboko w przeszłość. Jakie są zalety i ograniczenia takich modeli?...
Czytaj dalej