W kolejnej edycji przeglądu tekstów naukowych o Wikipedii przeczytać można o trudnościach w wykrywaniu maszynowych edycji haseł, procesie definiowania gatunków muzycznych w dyskusjach między edytorami i edytorkami, metodach mierzenia "cyfrowego śladu" zbiorów muzealnych w Wikipedii oraz podejściu autorek i autorów tekstów naukowych do cytowań ich prac w treści haseł....
Czytaj dalej
Jak "fakty wikipedyczne" kształtują narracje literackie, czy agenty AI mogą nieustannie rozwijać encyklopedię i dlaczego - przynajmniej według niektórych - społeczność naukowa zdradziła Wikipedię? Zapraszamy do lektury kolejnego przeglądu tekstów naukowych z okazji 25-lecia Wikipedii....
Czytaj dalej
Do czego Wikipedia mogłaby inspirować historyków, jak dostępność ChatGPT wpłynęła na aktywność edytorów i czytelników Wikipedii, wykorzystanie haseł Wikipedii do testowania jakości modeli językowych oraz techniki manipulacji hasłami na temat wywołanej przez Rosję wojny w Ukrainie - to tematy artykułów z kolejnej części przeglądu tekstów naukowych dotyczących Wikipedii....
Czytaj dalej
Wikipedia ma dziś ćwierć wieku i jest częścią niewielkiego zbioru projektów internetowych, które przetrwały kilka epok technologicznych. Od początku była nie tylko encyklopedią, lecz także eksperymentem oddolnej i masowej produkcji wiedzy. Dziś jest jednym z najczęściej wykorzystywanych zasobów w badaniach i podstawowym źródłem treści do trenowania modeli sztucznej inteligencji. Setki artykułów naukowych analizują ją jako system społeczny, korpus językowy i infrastrukturę wiedzy. Zapraszam do lektury pierwszej notki z urodzinowego cyklu prezentującego ciekawe teksty naukowe poświęcone Wikipedii....
Czytaj dalej
Od czerwca 2023 roku działa rosyjski fork Wikipedii. Analiza różnic między treścią rosyjskiej Wikipedii a treścią RuWiki pozwala poznać metody, którymi autorytarne państwo może manipulować największą i dostępną dla wszystkich encyklopedią....
Czytaj dalej
Duża część detektorów, mających sprawdzać, czy dany tekst został wygenerowany przez LLM, bazuje na perpleksji. W konsekwencji, jeśli nie mamy naturalnie bogatego słownictwa, albo materia pracy pisemnej wymaga prostego języka, przygotowany przez nas tekst może zostać fałszywie oznaczony. Z tego powodu lepiej ręcznie starać się rozpoznawać generowane teksty. Metody takiego sprawdzania, użyteczne na przykład podczas oceny studenckich prac pisemnych, sugeruje społeczność Wikipedii....
Czytaj dalej
"Modele LLM często wykorzystują Wikipedię jako źródło, ale jednocześnie nie dają niezbędnej atrybucji, co w efekcie odsuwa użytkowników od bogatej struktury Wikipedii" czytamy w artykule "An endangered species: how LLMs threaten Wikipedia’s sustainability" (DOI: 10.1007/s00146-025-02199-9, 2025)....
Czytaj dalej