Tworzymy graf wiedzy

W projekcie GRAPHIA wspólnie z OPERAS i partnerami z całej Europy IBL PAN tworzy graf wiedzy dla europejskich nauk społecznych i humanistycznych (SSH). Po roku od startu projektu możemy podzielić się pierwszymi materiałami, które starają się w jasny i zrozumiały sposób opisać, czym będzie ta nowa infrastruktura. GRAPHIA ma ambicję stać się wyjątkowym narzędziem dla środowiska naukowego, jednak jej wartość będzie zależeć od powstającego wokół niej ekosystemu narzędzi, aplikacji i nowych modeli biznesowych, rozwijanych we współpracy z partnerami z sektora prywatnego. 

Choć prace nad interfejsami użytkownika i funkcjonalnościami jeszcze trwają, nie możemy się już doczekać efektów.

Zacznijmy od początku: czym jest graf wiedzy?

Graf wiedzy to semantyczna sieć połączeń, na przykład między publikacjami, autorami, instytucjami, projektami badawczymi, tematami, danymi źródłowymi i cytowaniami. W odróżnieniu od klasycznej bazy danych, graf wiedzy nie przechowuje informacji w tabelach, ale w postaci węzłów i relacji. Dane w grafie wiedzy powinny być:

  • identyfikowalne – każdy węzeł reprezentuje konkretną rzecz, osobę lub pojęcie,
  • opisane semantycznie – relacje między elementami (węzłami) są znaczące,
  • powiązane kontekstowo

Oznacza to, że graf wiedzy to nie tylko technologia – to sposób myślenia o danych jako o połączonym ekosystemie wiedzy, w którym każdy element (w grafie nazywa się go węzłem), np. autor, publikacja, instytucja, pojęcie ma swoją tożsamość i znaczenie oraz jest powiązany z innymi elementami kontekstem i relacjami.

Obejrzyj webinary z Julienem Homo, koordynatorem technicznym GRAPHIA, wyjaśniające, czym jest graf wiedzy:

Graf wiedzy jest odpowiedzią na fragmentaryczność danych i silosowość baz. W projekcie GRAPHIA jego celem jest:

  • integracja rozproszonych źródeł danych SSH w jednym modelu semantycznym,
  • umożliwienie analizy powiązań między publikacjami i danymi badawczymi,
  • umożliwienie zbudowania nowych narzędzi eksploracyjnych opartych na AI i dużych modelach językowych,
  • stworzenie indeksu cytowań dla nauk społecznych i humanistycznych.

Jakie są korzyści z projektu GRAPHIA?

GRAPHIA nie jest zamkniętym systemem budowanym wyłącznie przez i na potrzeby konsorcjum. To projekt infrastrukturalny, który zakłada współpracę z różnymi sektorami, np.: wydawnictw, infrastruktury IT, w tym firmami technologicznymi. Innymi słowy, oprócz przynoszenia korzyści środowisku naukowemu GRAPHIA stanowi również fundament pod nowe produkty i usługi, m.in. zaawansowanych wyszukiwarek i systemów rekomendacji, narzędzi analitycznych dla instytucji naukowych i administracji czy rozwiązań opartych na LLM, które operują na wiarygodnych, uporządkowanych danych naukowych.

Obecnie zespół techniczny intensywnie pracuje nad rozwiązaniami technicznymi, wspierany przez specalitów projektujących narzędzia dla użytkowników. Aby w pełni wykorzystać potencjał tej infrastruktury, zapraszamy do współpracy polskie software house’y, wydawców i firmy pracujące z danymi tekstowymi, aby podzieliły się z nami swoimi potrzebami i oczekiwaniami wobec grafu wiedzy, wiążącego różnorodne źródła danych z nauk humanistycznych i społecznych. 

Jeśli budujecie rozwiązania oparte na analizie treści, AI, wyszukiwaniu semantycznym lub przetwarzaniu języka naturalnego – graf wiedzy GRAPHIA może stać się podstawą, na której oprzecie swoje kolejne produkty.

Już dzisiaj możecie wyrazić swoje zainteresowanie udziałem w tworzeniu grafu wiedzy, odpowiadając na nasz krótki formularz:

Więcej informacji: https://graphia-ssh.eu/call-for-pilots/ 

Na odpowiedzi zespół GRAPHIA czeka do 5 marca, ale zainteresowanie współpracą w projekcie możemy wyrazić zawsze, pisząc na do nas na LinkedIn GRAPHIA lub adres email: contact@graphia-ssh.eu.