Co warto wiedzieć o danych badawczych w humanistyce?

Obowiązek opisania zasad postępowania z danymi przed, w trakcie i po zakończeniu projektu badawczego od paru lat jest normą w konkursach europejskich, a od zeszłego roku również w Narodowym Centrum Nauki. Plany zarządzania danymi mogą polegać na całkowitym „otwarciu” danych i udostępnieniu ich w wygodnych formatach innym badaczom i badaczkom, lub, jeśli kwestie etyczne na to nie pozwalają, zdeponowaniu ich w zamkniętym repozytorium.

Choć termin „dane” kojarzy się głównie z metodami ilościowymi lub branżą IT, coraz bardziej powszechne jest używanie go również do określenia materiału badawczego typowego dla nauk humanistycznych, np.: bibliografii, źródeł historycznych, fotografii, transkrypcji wywiadów. Podobnie jak dane ilościowe są przechowywane w formatach cyfrowych, które mogą zostać wygodnie opublikowane online, zdeponowane w repozytorium, a także ponownie wykorzystane przez innych badaczy. 

Jeśli chcecie poszerzyć swoją wiedzę na temat danych badawczych w humanistyce polecamy otwartą bibliotekę utworzoną w Zotero przez grupę roboczą DARIAH Research Data Management. A tak na marginesie: Zotero jest właśnie jednym z programów, który można wykorzystać do zarządzania danymi badawczymi, np. zbiorem artykułów prasowych czy video.

Regulacje prawne

8 grudnia 2021 weszła w życie ustawa z 23 lipca 2021 r. o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego, uwzględniająca zmiany wprowadzone Dyrektywą Parlamentu Europejskiego i Rady (UE) 2019/1024 z dnia 20 czerwca 2019 r. w sprawie otwartych danych i ponownego wykorzystywania informacji sektora publicznego.

W skrócie ustawa o otwartych danych:

  • definiuje dane badawcze jako: informacje sektora publicznego, utrwalone w postaci elektronicznej, wytworzone lub zgromadzone w ramach działalności naukowej, inne niż publikacje naukowe,
  • umożliwia szersze wykorzystywanie otwartych danych przede wszystkim w nowych produktach i usługach,
  • reguluje zasady i warunki wykorzystywania już udostępnionych danych,
  • reguluje funkcjonowanie portalu danych dane.gov.pl (wcześniej robiła to ustawa o dostępie do informacji publicznej),
  • nie określa zasad dostępu do danych ani tego, które dane badawcze muszą być udostępniane.

Zasady FAIR

Jeśli zetknęliście się już z tematem danych badawczych, zapewne również ten akronim nie jest Wam obcy. FAIR to skrót od findable (dające się wyszukać), accessible (dostępne), interoperable (zgodne z innymi narzędziami i usługami cyfrowymi) i reusable (umożliwiające ponowne wykorzystanie). Są to cztery ustalone zasady, jakimi powinni się kierować ludzie nauki, a także instytucje i usługodawcy, kiedy pracują z danymi badawczymi. 

Jeśli chcecie się dowiedzieć więcej o zasadach FAIR w humanistyce, polecamy raport ALLEA, opublikowane przed dwoma laty kompendium wiedzy na temat danych w naszej dziedzinie badawczej. O raporcie pisała również przed dwoma laty nasza koleżanka Mariola Wilczak w Biuletynie Polonistycznym

Zobacz raport: https://allea.org/portfolio-item/sustainable-and-fair-data-sharing-in-the-humanities

Data papers

Jako, że zarządzanie danymi to nadal dość świeży temat, często brakuje przykładów dobrych rozwiązań i praktyk. Tym bardziej, że każda dziedzina ma inną tradycję zbierania i porządkowania materiału badawczego. Aby zapełnić tę lukę, badacze coraz częściej proponują na większą skalę stosowanie w humanistyce publikacji typu data papers. 

Artykuły z danych to dokumenty, których głównym celem jest opisanie zbioru danych (przede wszystkim metadanych tego zbioru), kładące nacisk na sposób, w jaki został pozyskany oraz jego użyteczność i możliwość dalszego przetwarzania. Ten rodzaj publikacji jest jednym z elementów realizowania strategii FAIR dla danych, czyli właśnie dbałości o to, aby były wyszukiwalne, dostępne, dawały się przetwarzać i nadawały do ponownego wykorzystania.

Data papers są od lat jednym rodzajów publikacji w naukach ścisłych, ale w humanistyce i naukach społecznych nie odgrywały dotychczas większej roli. Mamy jednak nadzieję, że to się zmieni.

Czytaj więcej o data papers: https://roadtofair.hypotheses.org/364 

Przykłady udostępniania danych

Polecamy dwa: pierwszy to przegląd literatury o critical cataloging, opublikowany w Zotero, autorstwa Bri M. Watson. Powstał on przy okazji pracy nad artykułem naukowym i dzięki tej wygodnej formie, jest stale powiększany przez badaczy. My już z niego korzystaliśmy przy okazji pracy nad warsztatami z katalogowania krytycznego. 

Drugi jest efektem międzynarodowego projektu badawczego SHAPE-ID, w którym uczestniczył IBL PAN. Linki do zbiorów danych zostały opublikowane na oficjalnym blogu projektu, same zbiory natomiast zostały zdeponowane na Zenodo – otwartym repozytorium. 

Role w procesie badawczym

Stosowanie planów zarządzania danymi badawczymi w humanistyce wiąże się nie tylko ze stopniową ewolucją w publikowaniu naukowym, ale także ze zwróceniem uwagi na niedocenione dotychczas role w procesie badawczym. Osoby, które zbierają, porządkują, digitalizują i przetwarzają dane, z których korzystają badacze oraz autorzy i autorki publikacji naukowych, często nie są uwzględniane w systemach ewaluacji dorobku, choć walnie przyczyniają się do powstania prac naukowych. 

National Information Standards Organization – amerykańska organizacja pozarządowa, rozwijająca standardy pracy wydawców, bibliotekarzy i dostawców oprogramowania – przygotowała zestawienie 14 ról, które często nie są doceniane w akademickich systemach ewaluacyjnych. Wśród nich znalazły się m.in. Data Curation, czyli stanowiska związane z przetwarzaniem danych badawczych.

Jak i gdzie zdeponować dane badawcze?

Najlepiej w repozytorium, które specjalizuje się w przechowywaniu i udostępnianiu tego typu informacji. Wybierając repozytorium warto wziąć pod uwagę jego zasięg i rozpoznawalność w ramach naszej dyscypliny, maksymalną objętość plików, jaki możemy przechowywać bezpłatnie oraz formaty, w jakich będą dostępne do pobrania nasze dane po zdeponowaniu. 

W projektach CHC często korzystamy z darmowego repozytorium Zenodo. Przykładem ogólnodziedzinowego repozytorium danych jest także RepOD, prowadzony przez ICM UW. 

Badacze i badaczki społeczni w Polsce od niedawna mogą deponować swoje dane w specjalnie dla nich utworzonym Repozytorium Danych Społecznych, które współprowadzą Archiwum Danych Jakościowych przy IFiS PAN oraz Polskie Archiwum Danych Społecznych.

Na świecie istnieje przynajmniej kilka godnych polecenia repozytoriów danych badawczych, które są bezpłatne i dostępne dla WSZYSTKICH badaczy i badaczek, niezależnie od ich afiliacji. 

Opracowanie: Mateusz Franczak, Magdalena Wnuk (IBL PAN)