Vyhledat

iocb tech

hlavní partner portálu

Nezávislé informace o vědě a výzkumu

Autor: Blogger

Martin Víta se ve svém novém blogu věnuje hojně skloňovanému tématu Open Science. Na následujících řádcích nastiňuje, jak široký může být potenciál tohoto pojmu. Open Science totiž může skrývat příležitosti, které na první pohled možná nejsou zcela patrné.

christin hume mfB1B1s4sMc unsplash

Pojem open science se na českých akademických a výzkumných pracovištích včetně (v jistém smyslu podřazeného) pojmu open science data postupně zdomácňuje. Zvolna se začínají řešit otázky týkající se research data management, data management plan atp. - často na základě podmínek poskytovatelů podpory. Lze očekávat, že celá oblast týkající se vědy a dat bude nabývat na významu, což se bude odrážet i v rámci institucionálního zázemí výzkumných organizací.

Open science data obvykle bývají vymezena jako data, která vznikají v rámci výzkumu, přičemž jsou v souladu s tzv FAIR principy (F – findable, A – accessible, I – interoperable, R – reusable) a přístupu „as open as possible but as closed as necessary.“ Primárním cílem je bezesporu opětovné využívání výzkumných dat: jednou získaná data mohou posloužit jako podklad pro výzkum realizovaný dalšími jednotlivci či skupinami, čímž dochází k jeho akceleraci, přičemž určité přístupy mohou tento proces usnadňovat (např. využívání formátů s otevřenou specifikací, které nevyžadují pořizování proprietárního software, dále nejrůznější standardizace týkající se struktury dat – využívání sdílených datových schémat, ontologií, …).

V tomto příspěvku se však nechci věnovat přínosům open science data pro výzkum jako takový. Chtěl bych především naznačit, že jejich potenciál je daleko širší a skýtá příležitosti, které nejsou na první pohled patrné – zejména bych chtěl vyzdvihnout oblast lidských zdrojů, a oblast navazování spolupráce s dalšími subjekty čili témata v jistém smyslu související s PR.

K prvnímu tématu mě přivedla pozvánka kolegů z Nejvyššího kontrolního úřadu, kteří již několik let pořádají Hackathon veřejné správy (hackathon = intenzivní soustředění, na němž se dobrovolníci, typicky programátoři, analytici, UX experti aj. vytvářejí prototypy aplikací.) V případě zmíněného hackathonu jde o využití otevřených dat, která mají celkem nepřekvapivě původ ve veřejné správě. Není bez zajímavosti, že této akce se již několikráte účastnili „se svými daty“ i zástupci Sociologického ústavu AV ČR  - třebaže „jejich data“ nenaplňují definici otevřených dat veřejné správy, resp. otevřených dat ve smyslu zákona 106/1999 Sb. Nabízí se ovšem otázka, zda by analogickou akci nestálo za to uspořádat v momentě, kdy v ČR bude k dispozici určité nadkritické množství open science data.

Na akci nemusí jít nutně o výzkum nad těmito daty – přínosné mohou být i nejrůznější aktivity týkající se např. vizualizace dat, jejich čištění a obecně zvyšování jejich kvality. Velkou přidanou hodnotu pak může přinést propojování dat z různých zdrojů („...co třeba demografická a sociálně ekonomická data s daty meteorologickými…?“).

Vzhledem k popularitě hackatonu veřejné správy lze očekávat, že podobný hackathon, tentokráte nad open science daty z ČR, by mohl vzbudit podobný či ještě větší zájem, a to zejména proto, že:

  • programátoři a IT specialisté jsou ve své podstatě hraví, rádi řeší zajímavé výzvy,
  • prestiž vědy a výzkumu je patrně větší než prestiž veřejné správy, podobně je tomu s popularitou – nejrůznější popularizační akce se těší v poslední době značné oblibě.

Hackathon by navíc mohl vhodným způsobem doplnit akce typu Týden vědy apod. – mj. tím, že by oslovil další cílovou skupinu (vývojáři a „dataři“). Zapojení „datařů“ by mohlo být inspirativní pro obě strany.

Tím se dostáváme k obecnému přínosu takovéto akce: z trochu jiné perspektivy totiž jde o vynikající platformu pro navázání kontaktů, které lze následně využít v rámci HR aktivit. Prostřednictvím kontaktů, které získají představitelé jednotlivých institucí, které se „účastní svými daty“ hackathonu, lze oslovovat potenciální kandidáty na nejrůznější datově a analyticky orientované pozice a dále také prezentovat zainteresované instituce jako „zaměstnavatele, u kterého se pracuje se zajímavými daty“.

Hackathony navíc přirozeným způsobem selektují kandidáty motivované – se skutečným zájmem o problematiku, pro které nejsou typicky primární motivací peníze (třebaže ceny či finanční odměny by takovémuto hackathonu jistě slušely…). Jde o rozšiřování povědomí o dané instituci mezi freelancery.

Druhý pohled se týká spolupráce s informaticky orientovanými VŠ. K této perspektivě mě inspiroval inzerát postdocké pozice na Fyzikálním ústavu AV ČR, v němž padla zmínka o spolupráci s Pierre Auger Observatory. Jakožto člověku silně zvědavému mi to nedalo a proklikl jsem na stránky této organizace. Moji pozornost samozřejmě upoutala položka open data, za kterou se otevřela sekce, kde jsou nejen odkazy na jednotlivé datasety, ale také ukázkové aplikace včetně propojení s kaggle aj. Troufám si tvrdit, že jejich přístup může být ukázkou dobré (ba spíše vynikající!) praxe.

Dostupná, dobře zdokumentovaná data spolu s ukázkami – to vše podporuje využití těchto dat v rámci výuky. S nebývalým rozmachem vzdělávání v oblasti strojového učení, potažmo hlubokých neuronových sítí nabývá tato oblast na významu. Hledá student či cvičící zajímavý dataset třeba na demonstraci konvolučních neuronových sítí? Proč nenabídnout zajímavá výzkumná data? Studentů, kteří na VŠ procházejí kurzy AI/strojového učení/neuronových sítí jsou v ČR stovky, spíše však tisíce. Navázání kontaktu „přes data“ aspoň s některými z nich vytváří určitý potenciál. Buduje se tak i povědomí o instituci právě na relevantních katedrách, které vyučují kurzy ML, což je dobrý základ pro budoucí spolupráci.

Příslušná sekce na webu instituce, která slouží jako rozcestník k datům, může být navíc vhodným prostorem pro propagaci určitého typu pozic („hledáme výzkumného pracovníka se zaměřením na machine learning“…) či prezentaci instituce jako zaměstnavatele, který nabízí pozice v dané oblasti.

Pokusil jsem se naznačit, že open science data mohou být zajímavou komoditou, jejichž význam se netýká pouze samotného výzkumu, ale skýtají i příležitost v budování vztahu jak s potenciálními kandidáty na pozice, tak v navazování těsnější spolupráce s příslušnými katedrami VŠ. K tomu je však zapotřebí vytvořit na daných institucích, které jsou poskytovateli dat, komunikační strategii týkající se právě dat – tedy uvažovat o datech v širší perspektivě, než se možná na počátku zdá. K tématu mají totiž co říci nejen samotní „původci dat“, ale i oddělení, které se zabývají HR sférou či PR.

 

Autor: Martin Víta

 

Kategorie: Martin Víta