Vyhledat

iocb tech

hlavní partner portálu

Nezávislé informace o vědě a výzkumu

Představme si fiktivní výzkumnici Lenku, která zkoumá chronickou lymfocytární leukémii. Potřebuje k tomu rozsáhlý dataset s údaji o pacientech – ideálně i z dalších evropských zemí. Naráží ale na zásadní problém: jak se k takovým datům dostat a jak je zpracovat, když nejsou v jednotném formátu ani jazyce? Kolem roku 2030 by se tato situace mohla změnit díky evropskému nařízení o zdravotních údajích EHDS. Co toto nařízení přináší?

Co jsou zdravotní data a jak je získat

Zdravotní data jsou souborem informací o pacientovi. Jedná se například o osobní údaje, zdravotní záznamy, data o užívaných lécích, genetické informace, data z nositelných zařízení, informace o životním stylu. Primárně slouží k diagnostice a léčbě konkrétního pacienta. Jedním z hlavních cílů EHDS v této oblasti je zajistit, aby si zdravotnická zařízení data předávala ve srovnatelném standardu. Pacient by tak nemusel opakovaně sdělovat stejné informace a zároveň by měl snadný přístup ke svým záznamům.

Vedle toho existuje i tzv. sekundární využití dat – tedy jejich použití pro výzkum, inovace, veřejné zdraví nebo tvorbu politik.

Získávání zdravotních údajů pro výzkum musí vždy probíhat v souladu s právními předpisy, zejména GDPR. 

Výzkumníci se proto musí domlouvat s institucemi, které data spravují, a uzavírat s nimi smlouvy, které mohou mít různé podoby (např. data sharing agreement, data transfer agreement...). Tyto smlouvy nastavují zodpovědnosti a podmínky sdílení a žadatelé se zpravidla zavazují k tomu, že nebudou reidentifikovat konkrétní pacienty, nebudou data poskytovat třetí straně apod.

Jednou z možností, jak získat pro výzkum rozsáhlejší soubor dat, je obrátit se na Ústav zdravotnických informací a statistiky (ÚZIS), který sbírá data z nemocnic kvůli nejrůznějším statistikám. Aby bylo zaručeno, že pacienti nebudou identifikováni, ÚZIS využívá systém tzv. syntetických dat. „Syntetická data jsou vytvořena jako uměle vygenerovaná databáze s podobnou strukturou jako vybrané primární komponenty, tedy primární data Národního zdravotnického informačního systému (NZIS), ale bez reálných osobních údajů. Nelze je tak zpětně spojit s konkrétními lidmi.” říká Martin Komenda, vedoucí oddělení komunikačního a datového centra NZIS.

Jak si to představit v praxi? Ukažme si to na příkladu výše zmíněné fiktivní výzkumnice Lenky, která zkoumá lymfocytární leukémii. V reálných datech se například objevuje 63letý pacient, který se léčí 30 dní. Na základě těchto dat však vznikne syntetický dataset, kde se objeví například 61letý pacient léčený 35 dní. Tento „pacient“ ale není skutečný člověk – jde o uměle vytvořený záznam, který zachovává statistické vlastnosti původních dat, aniž by bylo možné identifikovat konkrétní osoby.

„Tato syntetická data umožňují vědcům připravit analytické skripty nebo dotazy, které následně pracovníci ÚZIS spouští nad originálními daty. Výstupem jsou opět pouze agregované ukazatele, které splňují podmínky ochrany osobních údajů. Tento režim výrazně rozšiřuje možnosti vědeckého využití NZIS, aniž by bylo nutné poskytovat primární data externím žadatelům. Přehled všech žádostí, jejich pořadí a stav v agendě systému syntetických dat NZIS jsou publikovány online. V průměru jsou vyřízeny asi 2,5 žádosti za jeden týden a celková doba od žádosti po předání dat je přibližně 16 dní,” říká Martin Komenda.

Ještě obtížnější je přístup k datům ze zahraničí. V tom případě je potřeba spolupracovat s národními registry nebo opět navázat spolupráce s konkrétními nemocnicemi nebo lékaři. Vědci však často naráží na problém, že data nejsou sjednocena. Například nemoci mohou být lékaři různě kódované, podle českého nebo anglického systému kódování, používají se různé zkratky a názvy pro tu samou diagnózu nebo i jen základní identifikátory jako pohlaví mohou být napsány různě. Toto si pak vědec musí sám ručně sjednotit a popsat, pokud nemocnice data nedodají v požadovaném formátu. Někdy se také v datech nachází jeden pacient dvakrát, aniž by měl výzkumník šanci tuto duplicitu odhalit. 

Co přináší nařízení EHDS

Evropský prostor pro zdravotní údaje (European Health Data Space – EHDS) je nové nařízení EU, které má za cíl vytvořit jednotný rámec pro používání a sdílení elektronických zdravotních dat napříč členskými státy EU. Toto nařízení je zásadní pro zlepšení přístupu ke zdravotním údajům, jejich bezpečné sdílení, etické a opětovné využití. To vše by mělo podpořit lepší zdravotní péči, výzkum a inovace v oblasti zdravotnictví.

Data budou spravována v souladu s principy FAIR – tedy dohledatelná, přístupná za jasně definovaných podmínek, interoperabilní a znovu využitelná. Nařízení vstoupilo v platnost před rokem – 26. března 2025.  Implementace však bude probíhat postupně až do roku 2031. V této době má být plně funkční infrastruktura MyHealth@EU, která zajistí přeshraniční výměnu elektronických zdravotních údajů v rámci primární péče.

Současně bude do roku 2031 zřízena a připojena také infrastruktura HealthData@EU (nyní pouze v testovací verzi), určená pro bezpečné sekundární využití zdravotních údajů pro účely výzkumu, inovací, veřejného zdraví a tvorby politik. „EHDS výrazně urychlí harmonizaci zdravotních údajů díky společným evropským standardům pro primární data. Nejde o to, aby lékaři zapisovali data speciálně pro vědecké účely — důležité je, aby zdravotní údaje byly v nějaké struktuře, ve srovnatelných formátech. Následně jsou jako datové sady v katalogu popsány kvalitními metadaty. To umožní jejich snažší sdílení napříč Evropou a efektivnější využití pro výzkum a inovace,” říká Zdenka Dudová, analytička Ústavu výpočetní techniky na Masarykově univerzitě v Brně a vedoucí pracovní skupiny Citlivá data v rámci iniciativy EOSC CZ.

Data nebudou ukládána centrálně, ale zůstanou v nemocnicích, budou takzvaně federovaná. Nemocnice však budou do Evropského katalogu datových sad poskytovat metadata – tedy informace o tom, jaká data mají k dispozici. V budoucnosti si tak díky jasnému a strukturovanému systému vědec zjistí, jaká data jsou k dispozici v databázi, kde se nacházejí a jak jsou kvalitní. Přístup ke zdravotním údajům by měl být efektivnější než nyní a bude umožněno jejich využití pro aplikovaný výzkum a inovace.

Když si vědec vybere potřebná data, vyplní detailní formulář popisující účel zpracování, cíle projektu nebo analýzy, plánované kroky zpracování atp.  Žádost pak dostane a zprocesuje subjekt pro přístup ke zdravotním údajům (Health Data Access Body), který komunikuje se všemi držiteli dat. Vědec zároveň dostane zprávu, kolik bude zpracování žádosti stát, aby se vyjádřil, zda má o data stále zájem. Na vyřízení žádosti bude platit lhůta, vědec by tak měl data dostat včas. Analýza dat pak bude probíhat v zabezpečeném prostředí, do kterého má přístup pouze schválený žadatel, a to prostřednictvím připravených nástrojů nebo vlastních skriptů. Přístup k datům bude časově omezený a vždy se bude řídit konkrétními podmínkami schválené žádosti. Tento model může částečně komplikovat reprodukovatelnost výsledků, protože práce bude probíhat v uzavřeném prostředí. Výstupy ve formě agregovaných dat a statistik však bude možné sdílet a jiní výzkumníci si budou moct podat novou žádost o stejná data. Na druhou stranu problém s reprodukovatelností medicínského výzkumu tu byl i dříve. 

Přečtěte si také

Replikační krize aneb proč nejsme schopni zopakovat výsledky a přiznat to?

V posledních deseti (v některých oborech patnácti) letech otřásá světovou vědeckou komunitou, zejména v sociálně-vědním a biomedicínském výzkumu, neschopnost zopakovat výsledky dříve provedených vědeckých studií. Pro tento fenomén se vžil název replikační krize. 

Sníží se díky EHDS náklady na výzkum?  

Vraťme se k fiktivní výzkumnici Lence. Pro Lenčin výzkum chronické lymfocytární leukémie představuje získávání zdravotních dat poměrně vysokou částku projektového rozpočtu, zejména, když je potřeba získat data i o pacientech v zahraničí. Dojde díky EHDS ke snížení těchto nákladů? Pravděpodobně nikoliv. „Na poskytnutí zdravotních dat nemocnicemi je, dle mého názoru, potřeba v projektovém rozpočtu vyhradit několik desítek až stovek tisíc. Co se týče financí na získání dat, není v současnosti jasné, zda pro vědce dojde k úsporám. Financování však přejde od přímého placení konkrétním lékařům na nemocnice, které si budou účtovat poplatky za poskytování dat a placení lékařům, kteří data zpracují, si budou řešit samy. EHDS pro vědce přináší větší transparentnost co se týče nákladů za poskytování dat, časovou záruku a informaci o kvalitě nabízených dat. V ideálním případě nabídne EHDS rychlejší, transparentnější a více zabezpečené zpracování dat. Větší zabezpečení celého prostředí samozřejmě nemusí být pro vědce výhodnější než postupy sdílení dnes, ale pro pacienty a jejich data to je určitě lepší,” myslí si Zdenka Dudová.

Pro výzkumnici Lenku by tak zavedení EHDS mohlo znamenat výrazné zjednodušení a zrychlení „nevědecké“ práce, jako je vyhledávání dat a jejich sjednocování. Data by měla být lépe standardizovaná a popsaná, což usnadní jejich využití. Proces získání dat bude centralizovanější a přehlednější, i když pravděpodobně nezmizí všechny administrativní kroky ani náklady.

Na plně funkční EHDS si však vědci ještě několik let počkají – celý systém je zatím ve fázi budování.

  • Autor článku: ano
  • Zdroj: VědaVýzkum.cz
Kategorie: Analýzy