Podpora a řízení mezinárodní spolupráce v oblasti výzkumu, vývoje a inovací (VaVaI) - ostatně stejně jako v jiných oblastech - nebo podpora mezinárodní mobility výzkumných pracovníků a pracovnic se neobejde bez adekvátní datové podpory. Kdybychom chtěli parafrázovat známý výrok, mohli bychom v této situaci patrně zvolat: „Data jsou.“ Ano, data skutečně jsou, ale…
Na úvod bych rád explicitně deklaroval osobní stanovisko, že v dané situaci (tj. lidské zdroje, finance, …) odvádějí provozovatelé a tvůrci systému IS VaVaI dobrou práci. O podobném systému si v řadě zemí, a to i velmi vyspělých, mohou nechat jen zdát. Nicméně existuje řada oblastí ve smyslu funkcionality a nabízených služeb, které nejsou dotaženy či vůbec nejsou pokryty, nejsou obsaženy ani v návrhu úprav IS VaVaI a ani se o nich nediskutuje, ač by jejich přínos mohl být značný.
Jednou z takových – na první pohled partikulárních – oblastí je poskytování strukturovaných informací o státní příslušnosti řešitelů výsledků evidovaných v RIVu v podobě otevřených dat.
Kdysi, když se rodila služba maps.google.com, jsem zaregistroval citát jednoho z duchovních otců tohoto projektu, který říkal něco ve smyslu, že „téměř každá informace má svoji geografickou dimenzi“ . Autora ani zdroj se mi bohužel v rychlosti nepodařilo dohledat, nicméně z hlediska obsahu to není až tak podstatné. Nejinak je tomu v případě výsledků VaVaI evidovaných v RIV. Podívejme se pro ilustraci na tento konkrétní příklad: výsledek Aktivní biouhel - fermentovaný substrát s biouhlem. Z tohoto záznamu lze usoudit, že – vágně řečeno – existovala nějaká forma spolupráce „s Tureckem“ na aplikovaném výzkumu (funkční vzorek) v oboru Soil science.
Pokud bychom se dívali nikoliv už na jednotlivé výsledky, ale celou kolekci výsledků z pohledu mezinárodní spolupráce, bylo by možné klást si otázky typu:
- Jak se vyvíjí intenzita spolupráce na aplikovaném výzkumu s konkrétní zemí v čase?
- Se kterými zeměmi nejvíce spolupracujeme v aplikovaném výzkumu?
- Se kterými zeměmi nejvíce spolupracujeme v daném oboru?
- Jaká je regionální distribuce (napříč ČR) spolupráce na výsledcích?
Ale třeba také:
- Kteří autoři v oblasti energetiky, virologie, umělé inteligence, vojenství atd. spolupracovali na netriviálním počtu výsledků třeba s autory z nedemokratických zemí?
V současné době na tyto otázky nejsme schopni jednoduše odpovědět. Data „sice jsou,“ ne však v takové podobě, která by naznačený způsob práce s nimi podporovala – tj. ve strojově čitelné podobě, ve formátu s otevřenou specifikací a s nevylučující licencí. To jsou právě klíčové charakteristiky otevřených dat tak, jak je definuje Zákon č. 106/1999 Sb., o svobodném přístupu k informacím. V definici otevřených dat je pak ještě podmínka registrace v Národním katalogu otevřených dat, která je ovšem z hlediska použití nepříliš významná.
IS VaVaI otevřená data poskytuje. Tato funkcionalita byla zprovozněna v návaznosti na schválené Nařízení vlády č. 425/2016 Sb., v jehož příloze byla data z ISVaVu explicitně uvedena. Nařízení bylo v srpnu t. r. zrušeno, protože je nyní pokryto novelou již zmíněného zák. č. 106/1999 Sb., která implementuje příslušnou evropskou směrnici. Při bližším prozkoumání ovšem zjistíme, že to s otevřenými daty IS VaVaI – především s RIVem – až tak jednoduché zas nebude. Není totiž poskytován RIV celý, jak by se dalo implicitně očekávat, ale pouze datová sada odpovídající roku 2019. Můžeme se ptát, proč zrovna tato?Tudíž myšlenka na nějaké analýzy změn intenzity čehokoliv v průběhu času bere za své. Jistě lze pochopit, že „nějaká obstarožní data“ nebude tak úplně jednoduché převést do podoby datové sady splňující „otevřenědatová“ kritéria, ale stálo by o tom na stránkách uvést alespoň drobnou informaci: „plánuje se/nelze–nebude, …“.
Dalším problémem, který se bezprostředně týká našeho tématu, je to, že otevřená data RIVu neobsahují všechny položky, které obsahují detaily výsledků poskytované přes webové rozhraní. Seznam položek publikovaných v „otevřené datové sadě“ je obsažen v CSVW schématu, které je k dispozici. Vidíme ovšem, že státní příslušnosti tam zmíněny nejsou. O důvodu lze jen spekulovat. Ochrana osobních údajů nepřipadá v úvahu – pokud by byl problém v tomto, pak by samozřejmě musel být i problém se zveřejňováním těchto dat v podobě HTML stránek.
Situaci by šlo obejít tzv. harvestováním RIVu a následným parsováním HTML kódu, nicméně příliš mnoho http požadavků vede k zablokování ze strany provozovatele, což je vcelku pochopitelné. Možná, že data o státní příslušnosti tvůrců by bylo možné získat přes inzerované API (také možnost, jak naplnit české legislativní požadavky na otevřená data), jenže o přístup k API je zapotřebí zažádat a uvést pevnou IP adresu, což rozhodně nelze považovat za neomezující přístup, čili o open data ani v případě API nejde. Řešení tohoto dílčího problému je v zásadě jednoduché – a není nutné se uchylovat k oklikám: v CSVW schématu (a samozřejmě přímo v datové sadě) by tato data měla být doplněna. Dále by bylo více než vhodné neomezovat se na rok 2019 a poskytovat RIV jako otevřená data celý.
Tím se umožní připravovat na základě těchto dat analýzy o mezinárodní spolupráci v oblasti VaVaI. A to včetně vizualizací – vzpomeňme na pozitivní ohlasy po spuštění Mapy vědců z iniciativy Czexpats In Science. Především ale bude možné „datově-analyticky“ podpořit nejrůznější aktivity státu v oblasti mezinárodní spolupráce – od RVVI přes jednotlivé poskytovatele, zejména TA ČR a GA ČR, ale také třeba MZV ČR či aktivity Českých center v zahraničí v oblasti VaVaI. Nesmíme opomenout také na analytickou podporu pro zajišťování bezpečnosti státu, dnes čím dál aktuálnější. Cílem je evidence-based policy, a nikoliv v ČR tak populární „feeling-based policy“. A kvalitní otevřená data jsou tím správným prostředkem.
Autor: Martin Víta