Perzistentní identifikátory jsou digitální nástroje, které slouží k jednoznačné a trvalé identifikaci osob, institucí a dalších objektů (např. článků, datových sad, software) ve vědecké komunikaci. Mezi nejznámější a nejvyužívanější patří například DOI (Digital Object Identifier) pro digitální objekty či ORCID (Open Researcher and Contributor IDentifier) pro výzkumníky. Identifikátory pomáhají jasně identifikovat a vyznačit vzájemné vztahy mezi výsledky výzkumu, jejich autory či přispěvateli, poskytovateli financí, granty, výzkumnými projekty a dalšími entitami v jednotlivých procesech VaVaI.
Jaké je nejvýznamnější uplatnění perzistentních identifikátorů? V jaké oblasti vidíte jejich největší potenciál pro výzkum a vývoj?
Plošné zavedení řady perzistentních identifikátorů (dále PID, pozn. redakce) by přineslo řadu výhod, jež by měly dopad jak na jednotlivce, jejich organizace, tak i na širší komunitu (v akademickém prostředí i mimo ně).
Mezi tyto benefity například patří úspora času a minimalizování chyb. Prostřednictvím automatizace a předvyplnění polí pomocí zadání jediného PID lze snížit počet opakovaného zadávání stále stejných informací. Sníží se tak i chybovost při vyplňování údajů.
Dalším přínosem je zlepšení vyhledávání – výzkumným pracovníkům a dalším osobám umožní PID rychle najít informace, které potřebují. PID rovněž umožňují spolehlivé citování ve vědecké literatuře. Díky tomu je možné správně připsat výzkumnicím a výzkumníkům podíl na výstupech jejich výzkumu. To vede mimo jiné také ke zlepšení integrity ve výzkumu, protože je jednoznačně zřejmé, odkud citované informace pochází a kdo je jejich autor. S tím nakonec souvisí i to, že PID obecně podporují myšlenku otevřené vědy a jsou jedním z pilířů FAIR principů pro správu a řízení vědeckých dat. Bez perzistentních identifikátorů zkrátka nelze principy FAIR dost dobře naplnit.
Nakonec chci také zdůraznit, že PID tím, že trvale a spolehlivě propojují výzkumníky, jejich výstupy a jejich instituce, přinášejí klíčová data pro strategické rozhodování o prioritách výzkumu – včetně návratnosti investic a dlouhodobého dopadu výzkumu.
Zmínila jste investice do vědy. Lze říct, že využívání PID pomůže ušetřit finanční prostředky?
Přesně tak. Bezprostředním přínosem užívání PID v oblasti výzkumu a vývoje by s největší pravděpodobností byla úspora nákladů, ale z dlouhodobého hlediska nelze podceňovat strategický přínos, který vyplývá ze snadného přístupu ke spolehlivým informacím o řízení výzkumu. Představte si, jakou sílu má možnost díky PID snadno identifikovat, propojit a analyzovat dosah a dopad veškerého výzkumu, který jste provedli nebo podpořili – ať už jako výzkumník, poskytovatel financí nebo instituce!
Dotkla jste se také FAIR principů. Jakou roli hrají PID v rámci otevřené vědy a FAIR správě a řízení vědeckých dat?
Jak již bylo zmíněno výše, bez PID opravdu nelze být fér ani FAIR. Téměř všechny aspekty – vyhledatelnost (Findability), dostupnost (Accessibility), interoperabilita (Interoperability) a opakované použití (Reuse) – se opírají o používání PID a/nebo obecně metadat výsledků výzkumu.
Vlastně hned prvním principem FAIR (F1) je, že (meta)datům jsou přiřazeny globálně jedinečné a trvalé identifikátory. Navíc, abychom byli přesní, takto zní její podrobnější popis: „Zásada F1 je pravděpodobně nejdůležitější, protože bez globálně jedinečných a trvalých identifikátorů bude těžké dosáhnout dalších aspektů FAIR. Proto již dodržování zásady F1 vás posune na cestě ke zveřejňování dat podle FAIR principů.“
Z naší strany musíme také maximálně zdůraznit, jak klíčové jsou PID pro otevřenou vědu obecně a o kolik větší přínos by mohly mít, kdyby byly plošně implementovány. Velice se například osvědčilo, aby metadata spojená s PID zahrnovala informace i o původu – kdo, kdy a jak data přidal –, což buduje důvěru v tato data.
Informace, které proudí, šetří čas
Tým v organizaci MoreBrains, kde působíte, vytvořil analýzy, jež porovnávají náklady a přínosy zavedení PID v Austrálii a ve Velké Británii. Tyto analýzy přinesly zajímavé výsledky. Mohla byste zmínit některé klíčové poznatky?
Bylo skvělé, že jsme prostřednictvím práce, kterou jsme provedli pro Austrálii a Velkou Británii, mohli pomoci jasně demonstrovat konkrétní přínosy široké implementace PID.
V obou případech jsme se zaměřili na pět prioritních PID (všechny otevřené), které se používají pro identifikaci nejčastějších entit ve výzkumu: DOI pro výstupy výzkumu (registrační agentury Crossref a DataCite), DOI pro granty (registrační agentury Crossref), ORCID iD pro výzkumníky a další přispěvatele, RAiD pro výzkumné projekty a ROR ID pro výzkumné organizace.
Díky našim analýzám nyní s jistotou víme, že používání identifikátorů PID vede k významným časovým – a tedy i finančním – úsporám. Například jsme spočítali, že v Austrálii se každoročně promarní 38 000 člověkodní při opakovaném zadávání stejných údajů o publikacích, grantech a projektech do různých výzkumných systémů, což ročně stojí přibližně 14,4 milionu eur. Ve Spojeném království je to pak 55 000 člověkodní a 21,8 milionu eur.
Opravdu ušetří tolik času pouze zavedení PID do praxe?
Tyto časové a finanční úspory samozřejmě vznikají za použití více typů PID zároveň, jako jsou ORCID a ROR, které vyznačují vztahy mezi osobami a jejich afiliacemi.
Mohu to ukázat na konkrétnějším příkladu. Profesor Joe Shapter, prorektor pro výzkumnou infrastrukturu na University of Queensland, odhaduje, že pouhá integrace ORCID do systému Australské výzkumné rady (Australian Research Council – ARC, pozn. redakce) mu šetří tři až čtyři dny práce na jedné žádosti o grant. Je to proto, že namísto ručního zadávání informací o instituci, publikacích, předchozích grantech atd. si ARC vše automaticky stáhne z jeho záznamu ORCID.
Přestože jsme všichni v naší organizaci MoreBrains byli přesvědčeni, že budeme schopni prokázat, že zavedení PID přinese úspory nákladů, překvapil nás rozsah těchto úspor. Zejména proto, že víme, že tato čísla představují jen špičku ledovce. PID napomáhají efektivitě také díky automatizaci toku dat v rámci systémů a mezi nimi, jakož i díky agregaci a analýze informací. To je ale něco, co se měří výrazně obtížněji, takže jsme tento pohled (zatím) nemohli zahrnout do našich analýz.
V současné době provádíme analýzu nákladů a přínosů PID pro Irsko, která je součástí práce Národního fóra pro otevřený výzkum na vytvoření národní strategie PID. O výsledcích této analýzy se dozvíte víc v následujících měsících.
Je tedy poměrně zřetelné, proč je zavedení PID výhodné z hlediska celého systému VaV. V Česku bylo například letos za tímto účelem založeno Národní centrum ORCID a DOI. Jak ale může jejich využívání obohatit individuální výzkumníky a výzkumnice?
V této souvislosti je třeba zmínit ORCID, trvalý identifikátor výzkumníků a dalších osob přispívajících k výsledkům výzkumu. Na rozdíl od většiny ostatních identifikátorů osob je ORCID zcela otevřený a globální a lze jej integrovat do jakéhokoli systému nebo platformy. S ORCID jsou například integrovány platformy Web of Science či Elsevier, což výzkumným pracovníkům umožňuje propojit v nich využívané identifikátory Researcher ID a Scopus ID a údaje s nimi spojené s jejich profilem ORCID.
Informace díky tomu mohou proudit mezi ORCID a těmito dalšími systémy. Například aktualizace provedené v profilu ORCID jsou přístupné domovským institucím výzkumníka, které mohou rovněž provádět aktualizace v jeho záznamu ORCID. Jedním z cílů ORCID je, aby výzkumnice a výzkumníci mohli zadat informace pouze jednou a aby je pak bylo možné opakovaně používat. Propojení dalších identifikátorů výzkumných pracovníků s identifikátorem ORCID pomáhá tento cíl uskutečňovat.
Mohou výzkumníci udělat něco pro to, aby se realizoval potenciál užívání PID a skutečně se tak uspořil čas i peníze?
V tomto směru je pro výzkumné pracovníky nejdůležitější získat a používat identifikátor ORCID iD. Zejména tím, že dají členům ORCID (tedy důvěryhodným organizacím) povolení číst a zapisovat do jejich ORCID záznamu. Nejenže si tím vědci a vědkyně významně usnadní život (kdo by raději zadával údaje ručně!?), ale také tento úkon zajišťuje to, že informace v jejich ORCID záznamu o jejich afiliaci, publikacích či dalších odborných činnostech jsou úplné, aktuální a ověřené.
Zároveň se tyto informace dají jednoduše sdílet v dalších systémech a s ostatními institucemi. Skvělým příkladem jsou procesy automatické aktualizace Crossref a DataCite: zadáním ORCID iD například během procesu předkládání rukopisu u vydavatele a jednorázovým udělením povolení službám Crossref nebo DataCite se pak záznamy ORCID výzkumných pracovníků automaticky aktualizují vždy, když je zaregistrován DOI pro některou z jejich publikací.
A co pro to mohou udělat výzkumné organizace?
Výzkumné organizace mohou přispět k využití potenciálu PID tím, že budou PID integrovat do svých systémů tak, aby byla možná vzájemná výměna informací mezi jednotlivými systémy – to znamená na základě osvědčených postupů, které vytvářejí poskytovatelé PID.
Je něco, co byste popřála českým výzkumníkům a výzkumnicím, kteří se chystají PID vyzkoušet?
K vybudování výzkumného cyklu optimalizovaného pro PID – takového, kde se PID registrují pro všechny entity, co nejdříve je to ve výzkumném procesu možné, jsou k nim připojena úplná metadata a jsou automatizovaně sdíleny napříč různými systémy (např. systémy grantových agentur, repozitáře, vydavatelské systémy, systémy pro vykazování výsledků výzkumu) – bude zapotřebí skutečného úsilí celé vědecké komunity. Pevně doufám, že se česká výzkumná komunita do tohoto úsilí zapojí, aby i zdejší výzkumníci museli méně svého vzácného času trávit byrokracií.
Autor: Vědavýzkum.cz(JT)
Text vznikl ve spolupráci s Národní technickou knihovnou.
Alice Meadows
Kariéra Alice Meadows v oblasti vědecké komunikace, publikování a výzkumných infrastruktur je dlouhá a stále se rozvíjí. Od vedení vlastní marketingové agentury až po řadu pozic ve společnostech Blackwell, Wiley, ORCID a National Information Standards Organizations (NISO) si Alice vybudovala pověst stratéga. Během svého působení ve společnosti ORCID vybudovala jako ředitelka pro komunikaci a zapojení komunity rozsáhlý globální tým specializovaných pracovníků, kteří podporují velmi různorodou komunitu výzkumných pracovníků a členských organizací společnosti ORCID.
Alice Meadows pracuje ve společnosti MoreBrains už od jejího založení. Kromě toho Alice Meadows v letech 2022-23 bývala také prezidentkou Společnosti pro vědecké publikování (SSP), aktuálně je zapojena také do projektu Scholarly Kitchen. Je autorkou řady článků a přednášek na témata, jako je otevřený výzkum, důvěra, vzájemné hodnocení a DEIA; je členkou řídicí skupiny DataCite pro zapojení komunity a výboru SSP DEIA; hrála klíčovou roli při vzniku i organizaci komunitních akcí. Je držitelkou ceny SSP Distinguished Service Award (2018), ceny ALPSP za přínos vědeckému publikování (2016) a ceny ISMTE Recognition Award (2013).