Vyhledat

iocb tech

hlavní partner portálu

Nezávislé informace o vědě a výzkumu

Rozhovor s Danielem Mikšíkem o tom, jakou úlohu sehrává Národní datová infrastruktura, jaký význam mají metodici a správci repozitářů a jaké benefity může přinést nové hodnocení datových sad jako samostatného výsledku výzkumu.

Profesní dráha Daniela Mikšíka není na první pohled typicky přímočará. Vystudoval anglistiku a bohemistiku, dlouhodobě se však pohybuje na pomezí technologií, výzkumu a podpůrných služeb pro vědu. Právě tato kombinace humanitního vzdělání a technologické IT praxe mu umožňuje nahlížet na výzkumná data především jako na nástroj, který má sloužit lidem.

Vaše profesní dráha je poměrně neobvyklá – od anglistiky a bohemistiky až k vedení IT centra. Jak vás humanitní vzdělání ovlivňuje v tom, jak dnes přemýšlíte o technologiích ve vědě a výzkumu?

To je těžká otázka, protože vypreparovat z dosavadní životní zkušenosti specificky humanitní vzdělání a jeho vliv dost dobře neumím. Sleduji ale práci kolegů z mé mateřské Filozofické fakulty Masarykovy univerzity na webu Digital Humanities a tam mě nedávno zaujal článek o konceptu výzkumných dat – vykládat a zpřesňovat základní pojmy používané k popisu spojité skutečnosti je za mě trvale důležitý příspěvek humanitních věd, pokud to dělají dobře. Klíčové sdělení textu a odkazované literatury pro mě bylo ještě o něco bazálnější. Ústřední role ve vědeckém provozu (stále ještě) náleží konkrétním lidem, kteří mají hluboké znalosti a netriviální dovednosti, z nichž pramení jejich schopnost rozhodnout se, jaké údaje potřebují shromáždit a jak je musí zpracovat, aby je pak mohli věrohodně a smysluplně interpretovat. Tito jednotliví, koneční, omylní, poctiví a vášniví lidé budují z „hromad dat“ poznání, a tyto lidi mají námi vyvíjené služby a nástroje v jejich práci podpořit.

V souvislosti s technologiemi často zaznívá, že by měly především sloužit lidem. Jak se tento princip podle vás promítá do správy výzkumných dat a národní infrastruktury, a kde v tom vidíte konkrétní přínos pro samotné vědce a vědkyně?

Když slyším, že technologie mají „především sloužit lidem“, zpozorním. Tahle formulace se totiž často používá tam, kde ve skutečnosti slouží hlavně velmi specifickým skupinám lidí. Proto bych „konkrétní přínos“ raději zjišťoval zpětně, zdola, z reálného používání. Mohu ale popsat, co už dnes při budování Národní datové infrastruktury děláme proto, aby ji vědci při každodenní práci skutečně mohli používat jako něco, co jim pomáhá a slouží – a ne naopak. Stavíme na technologiích, které jsou v oblasti ukládání a zpřístupňování výzkumných dat osvědčené a kvalitní (Invenio, DSpace, Data Stewardship Wizard aj.), a propojujeme je s existujícími infrastrukturními službami, zejména úložišti a výpočetním prostředím e-INFRA CZ. Nasazení zajišťují zkušení vývojáři, komunikaci s vědeckou komunitou metodici a na uživatelské zkušenosti systematicky pracuje specializovaný UX tým. Průběžně sbíráme zpětnou vazbu a zapracováváme ji do dalšího vývoje.

Před závorku je vytčen obecný princip navrhování a realizace IT služeb: identifikovali jsme potřebu kvalitní správy výzkumných dat a známé postupy, jak ji naplnit – repozitáře, principy FAIR, podporu strojového zpracování dat a metadat. Na jejich základě dnes vytváříme a zpřístupňujeme konkrétní nástroje: národní repozitářovou platformu, přenos dat z přístrojů, napojení na výpočetní prostředí a další služby.

Pak se ve skutečnosti „nejskutečnější“ obecný nástroj potká s konkrétní potřebou konkrétního vědce nebo týmu v jejich reálném kontextu, a my v komunikaci s nimi zjišťujeme, co funguje, co chybí a kde je potřeba nástroje dál rozvíjet, aby dávaly smysl v praxi. A tato zjištění pak zakomponujeme do dalšího vývoje.

Přečtěte si také

ZČU přispěje k budování české datové infrastruktury pro vědu

Nový národní repozitář s názvem DANTEc, jehož cílem je posílit sdílení výzkumných dat v souladu s principy otevřené vědy, pomohou vytvořit akademici ze Západočeské univerzity v Plzni. ZČU hostila úvodní setkání skupiny pro materiálové vědy v projektu Open Science II z Operačního programu JAK.

Zkušenost z praxe ukazuje, že data sama o sobě nestačí. Jak důležitá je podle vás role metodiků, správců repozitářů a lokální podpory na institucích pro to, aby s daty šlo reálně pracovat? 

Pravidlech pro zakládání repozitářů v NRP je repozitář definován jako „technické, personální a procesní zajištění dlouhodobého úložiště pro ukládání a publikaci citovatelných digitálních objektů“. Jako většina definic je trochu šroubovaná, ale v první části dobře vystihuje, že repozitář není jen technologie. Teprve dlouhodobou a kvalifikovanou péčí o to, aby repozitář obsahoval relevantní a dobře popsaná data, která jsou transparentně přístupná a znovu využitelná, se z technického řešení stává funkční celek, který v konkrétní vědecké komunitě může po čase plnit roli důvěryhodného zdroje dat. Členové dané odborné komunity tvořící tým repozitáře (správci, datoví kurátoři, technická podpora) jsou nedílnou součástí tohoto celku.

Od letošního roku je možné vykazovat datové sady jako samostatný výsledek typu T. Co tento krok podle vás znamená pro postavení výzkumných dat ve vědě? 

To je, myslím, ještě obtížné hodnotit. Za sebe to vnímám především jako odraz již probíhající změny ve vědecké praxi – o data je vhodné pečovat, a proto úroveň této péče bude součástí hodnocení vědecko-výzkumných institucí.

Jak budou na druhé straně s vykázanými digitálními kolekcemi dat následně pracovat hodnotitelé, a tedy jak se datové sady a jejich parametry skutečně promítnou do hodnocení jednotlivých institucí, se teprve musí ustavit. A také na tom bude záviset, jaké signály tento proces zpětně vyšle do institucí a přes ně do české vědecké komunity, a jak se nakonec tyto signály projeví v rozhodování institucí i jednotlivých vědců, vědkyň a vědeckých týmů.

Může to podle vás změnit způsob, jak vědci o datech přemýšlejí už v průběhu výzkumu, a ne až ve chvíli, kdy se řeší závěrečné vykazování výsledků? 

Jak výzkumníci přistupují ke svým datům, je výsledkem mnoha faktorů. Vykazování digitálních kolekcí dat bude jedním z nich, ale osobně bych jeho roli nepřeceňoval. Podle mě mají mnohem větší význam zvyklosti a standardy v jednotlivých vědeckých komunitách, tedy jaká data má smysl ukládat a zpřístupňovat, jak je potřeba je popsat, a dále institucionální podpora v podobě strategie, interních předpisů a dostupnosti podpůrného personálu. A souvisí s tím také vzdělávání, tedy v jaké podobě se data management daří učinit součástí vysokoškolského studia nebo celoživotního studia. Všechny tyto oblasti se snaží systematicky podpořit a rozvíjet i národní implementace iniciativy EOSC.

Součástí infrastruktury je i Národní metadatový adresář (NMA). Proč je důležitý i pro vědce, kteří se o infrastrukturu běžně nezajímají?

Pokud se podaří naplnit ambici shromažďovat v NMA metadata o datových sadách afiliovaných k českým institucím téměř v reálném čase, vznikne služba s unikátním obsahem a dalšími důležitými vlastnostmi, například s veřejným API, které umožňuje shromážděná metadata s minimálními náklady vyčíst a následně zpracovat.

Díky jednotnému metadatovému standardu bude možné vyhledávat datové sady napříč tematickými repozitáři, identifikovat jejich překryvy a metadata dále propojovat. V první fázi bude tato služba relevantní zejména pro instituce (přehledy a analýzy). S přibývajícími repozitáři vybudovanými v prostředí Národní repozitářové platformy (NRP) se její přínos, předpokládám, stane zřejmějším i pro samotné výzkumnice a výzkumníky.

 

Autorka: Lucie Skřičková

Zdroj: EOSC CZ


Daniel Mikšík vystudoval anglistiku a český jazyk a literaturu na Filozofické fakultě Masarykovy univerzity. V současnosti působí jako IT architekt v rámci Ústavu výpočetní techniky MU, ve výzkumném centru CERIT-SC, které se zaměřuje na datově náročný výzkum a podporu vědeckých komunit. V projektu Národní repozitářové platformy (NRP) vede aktivitu zaměřenou na pilotní repozitáře (KA3), jejichž úkolem je testovat a ověřovat budovaná řešení pro správu, sdílení a dlouhodobé uchovávání výzkumných dat v souladu s principy FAIR.

  • Autor článku: ne
  • Zdroj: EOSC CZ
Kategorie: Rozhovory