Wolna wiedza, wspólna sprawa. Wikidata, nauka i otwarte dane

Konsorcjum OPERAS i fundacja Wikimedia zdają się naturalnymi sojusznikami w drodze do urzeczywistnienia się wizji w pełni otwartej komunikacji naukowej – takiej, która opiera się na swobodnym dostępnie nie tylko do wyników badań, lecz także do danych i infrastruktur wiedzy.

By Iopensa – Own work, CC0, https://commons.wikimedia.org/w/index.php?curid=154640327

Gdzie wolontariusz spotyka profesora

W dniach 5-6 czerwca 2025 roku Uniwersytet we Florencji stał się miejscem wyjątkowego dialogu pomiędzy reprezentantami akademii a aktywistami i wolontariuszami projektów Wikimedia, a więc osobami wychowanymi w analogowej rzeczywistości uniwersytetu i cyfrowymi obywatelami, członkami hierarchicznych wielowiekowych struktur i tymi, którzy odważnie demokratyzują naukę. Współczesna rzeczywistość tworzenia wiedzy sprawiła jednak, że konferencja nie była próbą konfrontacji dwóch odrębnych plemion, ale raczej spotkaniem ludzi, w których wspomniane wcześniej cechy mieszały się w najróżniejszych konfiguracjach. 

Konferencja „Wikidata and Research” miała na celu podsumowanie dotychczasowej synergii między środowiskiem akademickim a projektami Wikimedia i dalsze stymulowanie współpracy, ze szczególnym uwzględnieniem otwartych danych, otwartych infrastruktur badawczych i oceny badań. Ponadto była to doskonała okazja, by porozmawiać z humanistami, informatykami, specjalistami od komunikacji internetowej i naukowej, a także badaczami z innych dyscyplin i wolontariuszami o roli danych badawczych, architekturze informacji w naukowych praktykach komunikacyjnych, wpływie społeczno-gospodarczym akademii oraz roli otwartej nauki.

fot. Ada Jakubowska i Kasia Makowska

Do czego nauka potrzebuje Wikidaty?

W centrum uwagi znalazła się Wikidata – największy zbiór danych, liczący ponad 113 milionów elementów, kiedykolwiek wytworzony przez człowieka, która łączy otwarte zbiory danych udostępniane przez wolontariuszy, naukowców, instytucje kulturalne i publiczne z całego świata. Zapewnia także wsparcie dla wielu innych stron i usług, nie tylko projektów Wikimedia. Zawartość Wikidaty jest dostępna w ramach otwartej licencji CC0, a każdy użytkownik może ją odwiedzić i skorzystać z tego, co uzna za przydatne w swoich działaniach. Oferuje ona bowiem ustrukturyzowane dane, czytelne dla ludzi i maszyn, wielojęzyczne etykiety i opisy zasobów, różnorodne punkty dostępu (API, SPARQL, interfejs) oraz szereg dodatkowych usług i funkcjonalności pozwalających chociażby na wizualizację danych.

Konferencja „Wikidata and Research” pokazała, jak różnorodne są potrzeby środowiska naukowego i jak zróżnicowane bywa wykorzystanie tego gigantycznego zasobu w badaniach. Od prostych kwerend, pozwalających pozyskać dodatkowe metadane dotyczące interesujących nas zagadnień, przez traktowanie Wikidaty jako bazy wzorcowej i źródła trwałych identyfikatorów (PIDs) oraz miejsca przechowywania wyników pracy naukowej, aż po jej zastosowanie jako infrastruktury do prowadzenia złożonych badań, przetwarzania danych i modelowania informacji. W tym ostatnim przypadku wykorzystywano narzędzie Wikibase, które umożliwia tworzenie i zarządzanie własnymi bazami wiedzy opartymi na modelu danych Wikidaty. 

fot. Ada Jakubowska i Kasia Makowska

Bibliografie literackie jako dane: nowe podejście do kolekcji cyfrowych w humanistyce 

Wśród prezentowanych projektów znalazła się także inicjatywa z udziałem przedstawicieli polskiego środowiska OPERAS: „Using Wikidata in the European Literary Bibliography: A Reproducible Approach” autorstwa Gustavo Candeli (Uniwersytet w Alicante), Cezarego Rosińskiego (CHC IBL PAN) i Arka Margrafa (PCSS). Projekt ten proponuje nowe spojrzenie na zasoby humanistyczne – jako kolekcje danych. Instytucje GLAM (galerie, biblioteki, archiwa, muzea) coraz częściej udostępniają swoje kolekcje cyfrowe w sposób umożliwiający ich wykorzystanie przez maszyny. W jego ramach wykorzystano dane Europejskiej Bibliografii Literackiej (ELB, literarybibliography.eu), serwisu współtworzonego przez Instytut Badań Literackich PAN i Instytut Literatury Czeskiej CAN, łączącego tradycyjne podejście biblioteczne i bibliograficzne z myśleniem o nowoczesnej otwartej komunikacji naukowej. 

Opracowano także model przekształcania danych bibliograficznych zgodnie z zasadą Collections as Data, który umożliwia reprodukowalność procesu z użyciem różnych zbiorów. Obejmuje on m.in. ekstrakcję, modelowanie i wzbogacanie danych przy użyciu Linked Open Data oraz zasobów Wikidata, a także publikację danych wraz z dokumentacją. Na tej podstawie zaproponowano scenariusze badawcze, pozwalające m.in. na analizę porównawczą hiszpańskich powieści o wampirach czy przegląd pisarzy republikańskich, którzy wyemigrowali podczas hiszpańskiej wojny domowej. Projekt miał na celu pokazanie, jak dane bibliograficzne i otwarte zasoby wiedzy mogą stać się punktem wyjścia do badań literackich w nowoczesnej, cyfrowej formie.

Gustavo Candela, Cezary Rosiński, and Arkadiusz Margraf 2025. Using Wikidata in the European Literary Bibliography: A Reproducible Approach. In Wikidata and Research.

Współpraca Wikimedia Polska i Centrum Humanistyki Cyfrowej IBL PAN

Floreńska konferencja okazała się też doskonałą szansą na realizację długo planowanego pierwszego spotkania na żywo reprezentantów Wikimedia Polska (Katarzyna Makowska i Aga Jakupowska) oraz Centrum Humanistyki Cyfrowej IBL PAN (Cezary Rosiński). Rozmowy na temat zwiększania roli naukowców w przedsięwzięciach Wikimedia Polska oraz szerszego wykorzystania zasobów

fot. Ada Jakubowska i Kasia Makowska

Wikidaty i Wikipedii w polskich badaniach społecznych i humanistycznych pozwoliły na śmiałe zarysowanie dalszej współpracy. W tej wizji obecne są pomysły, jak demokratyzować i otwierać polską naukę, jakich starań należy dołożyć oraz jak wspólnie wypracowywać model badawczy, który bazuje na otwartych, interoperacyjnych i zrozumiałych zbiorach danych, a także jest realizowany w ramach otwartych infrastruktur badawczych. 

Florencja okazała się niezwykle łaskawa, oferując w pigułce spojrzenie na przemiany uprawiania badań w naukach humanistycznych i społecznych, zwiększającą się rolę otwartych infrastruktur i sieciowy charakter przedsięwzięć naukowych, który obok akademii uwzględnia także inne, często mniej oczywiste, podmioty. Środowisko otwartościowe może życzyć sobie więcej tak owocnych spotkań jak te podczas „Wikidata and Research” – i w miejscach tak pięknych, jak stolica Toskanii.

/aut. Cezary Rosiński