Zautomatyzowaliśmy rejestrowanie numerów DOI

W poprzednich wpisach (m.in. o tym, dlaczego warto deponować swoje prace w repozytoriach) pisaliśmy, dlaczego nadawanie publikacjom numerów DOI jest takie ważne. Niestety, choć rejestrowanie DOI ma ogromne znaczenie, z własnego doświadczenia wiemy, że do tego, aby poprawnie wypełnić dość żmudne formularze rejestracyjne dla numerów DOI, często brakuje rąk w redakcjach i wydawnictwach.

Co to właściwie znaczy zarejestrować numer DOI? Numer DOI to cyfrowy identyfikator „obiektu”, czyli w przypadku nauki różnego typu treści: artykułów naukowych i książek, ale także referatów, zbiorów danych, fotografii, infografik, wykresów. Zadaniem DOI jest uchronienie treści przed „zaginieniem” w sieci. Jeśli dany artykuł ma swoje DOI, będzie można go wyszukać za 5, 10, 20 lat, nie znając miejsca jego pierwotnej publikacji. DOI umożliwia drogę na skróty.

Aby DOI spełniało tę ważną rolę, musi zostać zarejestrowane w jednej z agencji Międzynarodowej Fundacji DOI, która ustala i podtrzymuje standardy tego cyfrowego identyfikatora. W IBL PAN DOI rejestrujemy za pośrednictwem Crossrefu. Procedura rejestracji w Crossref składa się z dwóch podstawowych etapów:

1. zarejestrowania podmiotu: wydawnictwa, czasopisma lub innej instytucji, w celu nadania mu tzw. prefixu DOI. Prefix określa wzór, według którego będą nadawane numery DOI kolejnych obiektów zgłaszanych do rejestracji przez dany podmiot.

2. Rejestrowania odrębnego numeru DOI dla każdego obiektu, w przypadku czasopism będzie to każdy numer czasopisma i każdy artykuł. Procedura ta wymaga każdorazowego uzupełnienia pól metadanych. Crossref umożliwia ręczne wypełnienie formularza metadanych lub przesłanie ich w formie sformatowanego pliku XML.

W IBL PAN dotychczas korzystaliśmy z tej pierwszej opcji, czyli wypełnialiśmy potrzebne pola ręcznie. Rejestrowanie DOI dla publikacji takich czasopism, jak „Teksty Drugie”, które wychodzi co dwa miesiące i w każdym numerze zawiera co najmniej 20 pozycji było więc dość żmudnym zajęciem, zajmującym ok. 3 godzin. Każda pomyłka wiązała się niestety z uzupełnianiem formularza na nowo lub, jeśli została przeoczona, nieprawidłowym zarejestrowaniem identyfikatora. Dlatego w CHC postanowiliśmy ten proces uprościć. 

Członkowie Polskiej Bibliografii Literackiej opracowali skrypt, dzięki któremu automatycznie zostały wygenerowane numery DOI dla zawartości 9 roczników „Napisu” – a więc dla każdego tekstu! Za prace odpowiedzialni byli dr Cezary Rosiński (koordynacja, konsultacje), Barbara Wachek (sprawdzanie danych) i Nikodem Wołczuk (autor skryptu).

Co wdrożenie skryptu dla automatycznego generowania DOI dokładnie oznacza w praktyce? Posiadając tabelę z metadanymi kolejnego wydania czasopisma według ustalonego wzoru, możemy wykorzystać skrypt przekształcający automatycznie tę tabelę na plik XML. Wszystko odbywa się bez wypełniania czasochłonnych formularzy. Następnie Crossref – system rejestracyjny numerów DOI – przeprowadza weryfikację pod kątem poprawności struktury pliku i technicznej poprawności danych. Na końcu DOI są rejestrowane.

Procedurę tę chcielibyśmy wdrożyć także dla innych redakcji w IBL PAN.

Więcej informacji od zespołu Polskiej Bibliografii Literackiej znajdziesz na ich stronie na Facebooku.