Perzistentní identifikátory ve výzkumu – k čemu všemu mohou být dobré a jaká jsou naopak úskalí jejich použití? Tato i další témata v Praze diskutovalo přes 250 expertů z celého světa při prvním ročníku konference PIDfest.
Konferenci zahájila hra na australský domorodý nástroj didgeridoo a vystoupení dejvického folklorního souboru Rosénka. Tento úvod napověděl, že spolupořadateli konference jsou australská organizace pro výzkumná data Australian Research Data Commons (ARDC) a česká Národní technická knihovna (NTK). Účastníky konference přivítal ředitel NTK Martin Svoboda. Ten zmínil, že Národní technická knihovna je nejen živým studentským hubem, ale i národním centrem pro elektronické zdroje a české vědecké komunitě poskytuje i další služby. „V rámci projektu CARDS věnovaném podpoře a zlepšování sdílení informačních zdrojů se věnujeme kvalitnímu popisu výzkumných datových sad metadaty a v té souvislosti i perzistentním identifikátorům,“ vysvětlil Martin Svoboda. Národní technická knihovna proto slouží od roku 2023 jako Národní centrum pro perzistentní identifikátory, které podporuje jejich zavádění v ČR. Po úvodním slovu ředitele NTK konferenci zahájila Rosie Hicks, ředitelka ARDC, která uvedla: „Klíčovou součástí mise naší organizace je zajistit, aby byl australský výzkum efektivní, aby vykazoval vysokou míru integrity a aby se v maximální míře vracely investice do něj vložené. Proto jsou perzistentní identifikátory páteří naší činnosti.“
Perzistentní identifikátory a jejich role ve vědě
Co jsou vlastně perzistentní identifikátory (PIDs)? Abyste mohli něco jednoznačně najít, je dobré mít příslušnou věc jednoznačně označenou. V současném prostředí komunikace vědy perzistentní identifikátory slouží k „inventarizaci“ či jednoznačné a trvalé identifikaci veškerých vědeckých výstupů i vstupů, od vědeckých článků po naměřená data uložená v digitálních repozitářích, ale např. i fyzické vzorky uložené v muzeích, na univerzitách apod.
Perzistentní identifikátory slouží k jednoznačné identifikaci osob, organizací, projektů a dalších objektů, jako jsou datové sady či software vzniklý při výzkumu. Pro využití jejich potenciálu by měly být vzájemně propojitelné, nést s sebou informace o popisovaném objektu (tzv. metadata) a měly by přetrvávat, i když se některé okolnosti změní – např. když je datová sada přesunuta z jednoho úložiště na jiné, nebo když si vědec / vědkyně změní jméno. Využití perzistentních identifikátorů je ale širší než v prostředí VaVaI, využívají je např. i streamovací společnosti jako Netflix nebo HBO pro filmy nebo stavební společnosti pro materiály využité v rámci staveb. Ve vědě mohou PIDs díky svým vlastnostem přinést jednoznačné výhody pro všechny hlavní aktéry – mohou mj. spořit čas výzkumníků při vyplňování žádosti o granty, mohou zefektivnit hodnocení výsledku výzkumu anebo usnadnit jejich dohledatelnost pro všechny.
Jak ukázal na příkladu ze svého profesního života první spíkr úvodního panelu konference, doktorand z Max Planck Institute Zefan Zheng. PIDs zásadním způsobem usnadňují, aby výzkumník dostal kredit za svoji odvedenou práci. Pokud začneme označovat PIDs např. datové sady, metodiky či software vzniklý v průběhu výzkumu, je možné jednoduše na tyto výsledky odkazovat obdobně, jako lze např. citovat článek pomocí identifikátoru DOI. Tím jsou zachyceny všechny příspěvky (a jejich autoři) k danému výzkumu nad rámec pouze článků.
Další panelistka, Joy Owango, z University of Nairobi v Keni, která vede africkou iniciativu African PID Alliance a centrum školicí výzkumníky v komunikaci, upozornila také na sociální a kulturní roli identifikátorů. Podle Owango mohou PIDs zviditelnit výzkumná data z Afriky a obecně zemí globálního Jihu a pomoci tak překonat předsudečné vnímání jejich vědy. Výsledky afrického výzkumu nebývají kompletně zobrazeny v příslušných databázích, výzkum v Africe také často probíhá pod vedením týmů z bohatších zemí, které si ale vzniklá data odvezou s sebou. PIDs mohou pomoci zviditelnit poznatky pocházející zejména ze znalostí domorodých národů a z objektů jejich kulturního dědictví, u nichž je složité propojit výsledek výzkumu a co přispělo k jeho vzniku.
Caroline Finch z australské Edith Cowan University představila několik oblastí, kde vidí PIDs jako klíčové ve své roli prorektorky pro výzkum. Používá je při nastavování pravidel pro excelentní výzkum – v tom je jí vodítkem mj. také národní strategie PIDs, kterou vytvořilo ARDC. PIDs jí pomáhají zvyšovat reputaci její univerzity – šířit výsledky výzkumu a zvyšovat jejich dosah. Nezastupitelnou roli mají také při managementu výzkumu – pro monitorování výsledků výzkumu a pro zefektivnění interních informačních systémů. V neposlední řadě PIDs pomáhají také rozvíjet kariéry výzkumníků na univerzitě. Naopak největšími výzvami pro plnohodnotné využití potenciálu PIDs je nepochopení jejich hodnoty ze strany akademických pracovníků. Dále pak fakt, že univerzity používají informace ve velkém množství kontextů, někdy duplicitně a investují prioritně spíše do systémů pro management studia, protože to je vnímáno jako hlavní role univerzit.
Historie perzistentních identifikátorů: od ISSN po RAiD
Simon Porter z britské technologické společnosti Digital Science stručně v úvodním hlavním panelu zmínil historii perzistentních identifikátorů – jedním z prvních identifikátorů byl tzv. ISSN identifikátor pro periodické publikace jako jsou noviny, časopisy a online žurnály, který začal být využíván před téměr padesáti lety (ještě před ním vznikl kód ISBN pro knihy). Porter zdůraznil, že identifikátory vznikají zpravidla z potřeb komunity a komunitu zároveň vytvářejí. V případě čísla ISSN šlo o komunitu vydavatelů, kteří potřebovali evidovat zkratky názvů periodik a jejich změn. Byl tedy zřízen Mezinárodní systém pro registraci seriálových publikací a přidělování ISSN řídí síť národních středisek ISSN, přičemž české národní středisko ISSN je součástí právě Národní technické knihovny.
Dále Simon Porter představil jeden z nejznámějších perzistentních identifikátorů ve vědecké komunitě, kterým je Digital Object Identifier (DOI), který začal být masivně využíván po roce 2000. Díky němu je možné jednoznačně rozlišit různé objekty v digitálním prostředí, např. vědecké články, ač jsou publikovány v různých databázích, jako je např. Elsevierova Science Direct, Springerův SpringerLink či PubMed. „Díky perzistentním identifikátorům mohou instituce snadno shromažďovat data z mnoha zdrojů a nemusí být na pochybách, jestli nemají nějaká data duplicitně. Díky tomu mohly vzniknout také nové informační produkty a služby,“ zdůraznil Porter. DOIs jsou však podle něj důležitá nejen pro vědecké publikace, ale i například pro datové sady. Jejich evidování se objevuje kolem roku 2009, tentokrát z popudu komunity knihoven. Porter zdůraznil, že perzistentní identifikátory nejsou jen pouhé nálepky, ale musí za nimi být i věrohodné metadatové schema – jazyk, který obsahuje potřebné informace o objektu a je srozumitelný ostatním, kteří identifikátor využívají.
Ověřený životopis ORCiD
„V roce 2010 pak přichází vědecká komunita zahrnující nejen vědce, ale i poskytovatele podpory výzkumu, nakladatele a instituce s myšlenkou ORCID iD, identifikátoru pro osoby aktivní ve vědě a výzkumu, který masivně rozšiřuje porozumění a myšlenku perzistentních identifikátorů a možností, jak mohou propojovat a pomoci s prokazováním a ověřováním pravdivosti informací,“ dokončil představení historie perzistentních identifikátorů Porter. ORCID iD umožňuje, aby výzkumník měl ve svém profilu informace vázající se k jeho osobě – publikace, granty, ceny apod. – i poté, co například změní jméno, opustí své pracoviště apod. Chris Schillum, výkonný ředitel neziskové organizace ORCID, která tento identifikátor spravuje, vysvětlil, že ORCID iD zvyšuje důvěryhodnost životopisu vědce, protože informace v něm mohou být potvrzeny ze dvou stran: ze strany vědce a ze strany druhého subjektu (např. univerzity, kterou vědec vystudoval). Oba, jak sám vědec, tak druhý subjekt, mohou informace do životopisu doplňovat, vědec je však musí vždy autorizovat.
Schillum však upozornil na to, že perzistentní identifikátory mají smysl až ve chvíli, kdy jsou opravdu globálně rozšířené a používané. „Myslel jsem si, že nejtěžší bude vyřešit technologickou stránku věci. Ale pak jsem zjistil, že technologie je ta jednodušší část. Nejtěžší je lidi zapojit a přesvědčit, aby identifikátory používali.“ Identifikátor ORCID iD podle jeho údajů nyní aktivně využívá 8,4 milionů výzkumníků (aktivně znamená, že v jejich profilu došlo v posledním roce k nějaké aktualizaci). Přičemž 44 % z dat uvedených v životopise byla validována i dalším subjektem.
Nové identifikátory
Oblast perzistentních identifikátorů se i nadále dynamicky rozvíjí. Mezi významné identifikátory vznikající teprve v posledních pěti letech patří identifikátor ROR (Research Organization Registry), který usnadňuje jednoznačnou identifikaci výzkumných organizací nebo RAiD (Research Activity Identifier) pro výzkumné aktivity, který má sloužit dle slov profesora archeologie a vedoucího vývoje tohoto PIDu v ARDC Shawna Rosse, jako „kontejner“, který bude sdružovat všechny identifikátory spojené s určitou výzkumnou aktivitou v průběhu let a usnadní dlouhodobě vyhledávání zapojených výzkumníků, získaných grantů, nejrůznějších druhů výsledků apod.
Ohlasy PIDfestu
Konference PIDfest se konala v Národní technické knihovně v Praze od 11. do 13. 6. 2024. Zúčastnilo se jí přes 250 lidí z celkem 34 zemí světa, z toho zhruba 100 virtuálně.
„Pracuji nově v německé Národní výzkumné datové infrastruktuře, naším cílem je digitalizovat výzkum v Německu. Myslím, že perzistentní identifikátory jsou důležitou součástí otevřené vědy a jejich využití může posílit transparentnost a důvěryhodnost vědy. Lidé by měli mít možnost se podívat na data, která výzkumník naměřil a být schopni třeba jeho pokus replikovat,“ říká jedna z účastnic PIDfestu Jana Tatscheck.
Konference PIDfest zaujala i Simone Frenzel z knihovních a informačních systémů při Německém výzkumném centru pro geovědy pod Helmholtzovým centrem v Postupimi. Toto centrum provozuje repozitář s daty z výzkumů o Zemi. Simone Frenzel ocenila zejména čas, který byl v rámci konference vyčleněn pro neformální setkání a diskuze mezi účastníky. „Jsme rádi, že první ročník konference proběhl s velmi pozitivní odezvou a že již nyní víme o institucích, které zvažují navázat pořádáním dalších ročníků. Jsme také hrdí na to, že se nám podařilo naplnit náš cíl přiblížit problematiku PIDs české komunitě a přivést do Prahy přední experty v této oblasti ,“ hodnotí konferenci jedna z organizátorek a vedoucí Národního centra pro perzistentní identifikátory v NTK Hana Heringová. Dodala, že všechny výstupy z konference budou volně dostupné v institucionálním repozitáři Národní technické knihovny.
Konference byla spolufinancována z projektu CARDS a sponzorů ARDC, Digital Science, ORCID a Open Science Framework.
Zdroj: Národní technická knihovna
Článek vznikl s copywritingovou podporou Vladislavy Vojtíškové (Vědavýzkum.cz)
- Autor článku: ne
- Zdroj: Národní technická knihovna