facebooktwittergoogle
Nezávislé informace o vědě a výzkumu
facebooktwittergoogle

European Open Science Cloud (EOSC) - věk dat ve výzkumu

8. 11. 2019
European Open Science Cloud (EOSC) - věk dat ve výzkumu

Pokud bychom začátek 21. století měli nějak pojmenovat, silným kandidátem by mohl být název „věk dat“. Připojení k internetu se od roku 1991, kdy byl WWW vynalezen a použit v CERNu, stalo součástí života široké veřejnosti. A právě připojení k internetu umožňuje dostupnost velkého množství dat jeho uživatelů ať už ze soukromé, nebo veřejné sféry, výzkumné pracovníky nevyjímaje.

S vývojem stále výkonnějších počítačů se množství dat násobí. Jejich využití s sebou přináší aplikace, které usnadní a zkvalitní náš život. Množství dat s sebou však přináší i nové výzvy, ať už týkající se ochrany soukromí jednotlivců, obchodních zájmů firem, nebo ty, které se týkají bezpečnosti států. Ekonomové začínají mluvit o novém druhu bohatství, o bohatství založeném na vlastnictví a využití dat.

Výzkumní pracovníci jsou aktéry i uživateli výsledků této proměny. Jednak iniciují a provádějí výzkum a vývoj nových systémů přenosu, ukládání, zpracování i využití dat, dále jsou těmi, kteří svou prací data generují, a konečně data používají k získání výsledků výzkumu. V roce 2015 přijala Evropská komise sdělení Strategie pro jednotný digitální trh v Evropě (Sdělení Komise Evropskému parlamentu, Radě, Evropskému hospodářskému a sociálnímu výboru a výboru regionů – Strategie pro jednotný digitální trh v Evropě, ve kterém si v tématu „Budování ekonomiky založené na datech“vytyčila pro rok 2016 úkol navrhnout evropskou iniciativu týkající se volného toku dat, která sníží bariéry volného pohybu dat, samozřejmě při zachování ochrany osobních údajů. Za nástroj k dosažení přístupnosti, interoperability a znovuvyužitelnosti dat, pořízených během výzkumu a vývoje z veřejných zdrojů, byl zvolen European Open Science Cloud, EOSC, tedy Evropský cloud pro otevřenou vědu.

Ani těm, kteří se na koncepci a stavbě EOSC podílejí, zatím není úplně jasné, co vše bude zahrnovat, ani jak přesně bude fungovat. S velkým zjednodušením lze říci, že se EOSC skládá ze tří na sobě nezávislých prvků působících ve vzájemné synergii, a to:

  • datových úložišť, v nichž se data ukládají a spravují,
  • širokopásmových přenosových sítí zajišťujících přenos dat,
  • supervýkonných počítačů, s jejichž pomocí lze data zpracovávat.

Díky EOSC bude data možno přesouvat, sdílet a znovu užívat i za hranicemi oborů výzkumu či států. Kromě toho, kdo data naměřil, je bude moci využít i ten, který k nim pouze získá přístup. Využitelnost dat však závisí na jejich zpracování. To zajišťují tzv. FAIR principy zpracování dat. Data by měla být: vyhledatelná (Findable), přístupná (Accesible), kompatibilní (Interoperable) a znovuvyužitelná (Re-usable).

V letech 2016-2018 pracovala Komise spolu s Evropským parlamentem i členskými státy na definování konceptu a kroků k implementaci EOSC. K průlomovým událostem došlo v roce 2018. V březnu Evropská komise publikovala svou Cestovní mapu implementace EOSC, ve které definuje šest směrů implementace EOSC. Jsou to: architektura federace infrastruktur, FAIR data, služby uživatelům, přístup a interface, pravidla účasti a správní struktura.

V květnu pak Rada pro konkurenceschopnost přijala závěry Rady o EOSC, ve kterých potvrdila správnost zvolených směrů a vyzvala Komisi, aby vyvinula úsilí k zahájení činnosti správní struktury EOSC. Tak se také stalo, a to ve Vídni v listopadu roku 2018. Následně během roku 2019 Výkonný výbor EOSC vytvořil Strategický plán implementace EOSC pro roky 2019 a 2020.

Správní struktura EOSC je tvořena správním výborem (Českou republiku zastupují delegáti Ministerstva školství, mládeže a tělovýchovy), dále výkonným výborem, tvořeným 11 členy vybranými Evropskou komisí (členem je Jan Hrušák) a fórem zúčastněných stran.

Exekutivní úroveň je podpořena poradními pracovními skupinami. Pracovní skupině Architektura s úkolem navrhnout technický rámec, ve kterém bude fungovat federace systémů obsažených v EOSC, předsedá Jean-Francois Abramatic. Pracovní skupinu FAIR vede Sarah Jones a jejím úkolem je implementovat principy FAIR do fungování EOSC včetně sémantické a právní interoperability, stanovení standardů pro data a jejich certifikace. Jan Hrušák vede pracovní skupinu Krajina, která má za úkol zmapovat výzkumné infrastruktury s potenciálem zapojení do EOSC. Pracovní skupina Pravidla účasti pracuje na jednoduchém souboru pravidel, práv, povinností a odpovědností uživatelů i poskytovatelů služeb EOSC a je vedena Juanem Bicarregui. Poslední z pracovních skupin, Udržitelnost, vedená Rupertem Lueckem a Conorem O‘Carrollem, posuzuje udržitelné business modely, varianty správních struktur a právnických osob EOSC. Celá správní struktura EOSC se opírá o sekretariát, financovaný Komisí z projektu programu Horizont 2020. Sekretariát provozuje informačně bohatý a uživatelsky přátelský web.

Zdrojem informací o již funkčních službách uživatelům je EOSC portál, opět podpořený Komisí. Na tomto portále je možno i některou službu nabídnout. Zdrojem financí pro uskutečnění EOSC je pro Českou republiku hlavně rámcový program Horizont 2020. A podpora to není nízká. Rozpočet Horizontu 2020 na koncepci a implementaci EOSC na léta 2018-2020 přesahuje 250 mil. eur. Z českých subjektů se do projektů úspěšně zapojil především CESNET (projekt EOSC-hub, PaNOSC, EOSCpilot, CS3MESH4EOSC), Masarykova univerzita v Brně (projekty OpenAIRE-Advance, EOSC-Life) nebo Lexical Computing, s. r. o., (projekt TRIPLE). Jako třetí strana projektu pak působí Univerzita Karlova v Praze (projekt SSHOC), Fyzikální ústav – ELI (PaNOSC) nebo UPOL (projekt EOSC-Life). Investice do rozšíření kapacity systému, například do datových úložišť, se však budou muset opírat o národní zdroje včetně strukturálních fondů.

Zdá se, že věk dat již začal. Jak to ovlivní způsob i možnosti provádění výzkumu a vývoje, však stále ještě zůstává otázkou. Budeme mít ve výzkumných organizacích „data stewardy“? Budou na EOSC dostupná data jen z výzkumných infrastruktur nebo i z výzkumných organizací? Jak dlouhé bude moratorium na data před jejich uveřejněním? Jak uvádět prvotního autora dat v citacích? Rozšíří se datová úložiště na síti CESNET nebo budou umístěna v knihovnách či ve výzkumných organizacích? Odpovědi na tyto i další otázky přinesou následující roky.

 

Autorka: Naděžda Witzányová

Článek vyšel v aktuálním čísle časopisu Echo, jehož elektronickou verzi najdete zde.