Vyhledat

iocb tech

hlavní partner portálu

Nezávislé informace o vědě a výzkumu

Vysoce citovaný článek, neboli Highly Cited Article, je název speciálního indikátoru databáze Web of Science, který pravidelně identifikuje první procento nejcitovanějších článků v širokých oborech. Označení Vysoce citovaný článek v konkurenci ostatních publikací znamená mimořádný vědecký ohlas a může ukazovat na dlouhodobě úspěšná témata i přelomový výzkum. Jak si v této prestižní skupině vedly články českých autorů publikované v roce 2024?

Citace (odkazy na vědecké práce autora v jiné odborné literatuře) jsou jedním z mála měřitelných parametrů vědeckého ohlasu. Odpověď na otázku, kdo je nejcitovanější vědec nebo publikace, není snadná, neboť ji ovlivňuje mnoho proměnných. Můžeme se ptát, zda má jít o prostý počet citací (pak se liší podle oboru), nebo chceme zahrnovat oborové normalizace? Má jít o jednoduchý indikátor, nebo složený, ve kterém budeme s cílem vyšší objektivity počítat ještě další parametry citovanosti? Analytičtí fajnšmekři mohou dále namítat, že citace jsou nejen pozitivní, ale i neutrální či negativní. A co s autocitacemi, tedy případy, kdy autor cituje sám sebe?      

Neexistuje služba, která by mapovala všechny citace. Údaj o citovanosti je vždy vázaný na určitý zdroj, nemusí proto přesně odpovídat skutečnosti. Obvykle existují ještě další citace, které daný zdroj nezachytil. Aby si však každý vědec poctivě vedl vlastní databázi veškeré citující literatury, je při současném rozsahu vědecké produkce prakticky nemožné. Citace nám proto vyhledávají a evidují největší multidisciplinární bibliografické databáze, jako jsou Web of Science, Scopus nebo Dimensions, které také zajišťují jednotný metadatový formát nutný pro jejich další analýzu. Web of Science má nejdelší historii – jeho předchůdce mapuje citace již od 60. let 20. století. Každá ze zmíněných tří databází však eviduje odlišné množství a strukturu časopisů. Proto i údaj o citacích, které každá z databází počítá vždy pouze ve své vlastní citační síti časopisů, může být dokonce i pro jednu a tutéž publikaci odlišný v závislosti na zdrojové databázi.

Highly cited papers a hot papers: mimořádný vědecký ohlas 

Citovanost můžeme vyjádřit prostým počtem citací, ale tento údaj by nebylo možné srovnávat mezi obory kvůli jejich rozdílným citačním zvyklostem. Proto raději pracujeme s takzvaně normalizovanými citacemi, které dávají možnost srovnání napříč obory. Normalizace uvádí citace do vztahu k očekávané citovanosti v daném oboru a pro daný rok vydání a typ článku. Když následně porovnáme absolutní hodnotu citací článku s tímto očekávaným průměrem, dozvíme se, zda je počet citací pod, nebo nad průměrem. Další možností je zařazení článku do percentilu žebříčku citovanosti v daném oboru. I takto je však nutné zachovat kritický přístup k interpretaci takového údaje. Aby citační analýza byla smysluplná, vyžaduje dostatečné množství dat. Vysokou míru důvěryhodnosti, i s vědomím jistých omezení, má indikátor Highly Cited, který odhaluje nejcitovanější články a produkuje jej databáze Web of Science. Na jeho základě  každoročně vzniká „žebříček” vysoce citovaných vědců (Highly Cited Researchers), který má značnou sledovanost. Jelikož jsme o tomto seznamu vědců nedávno psali zde, podívejme se na tento indikátor důkladněji.

V citační analýze je zaběhnutou praxí pracovat s percentily jako mírou oborové citační intenzity, Ty tedy nepřímo signalizují velikost dopadu na vědeckou komunitu. Prvních 10 procent nejcitovanějších článků v oboru (srovnáváme pouze články stejného typu a vydané ve stejném roce) považujeme za výzkum s mimořádně vysokým dopadem, první procento naznačuje takřka převratný výzkum. Nezbytné je tento signál dále kvalitativně ověřit. Indikátor Highly Cited využívá princip prvního procenta nejcitovanějších článků, ale ve struktuře poměrně širokých 22 oborů. Kvůli této struktuře je obtížné do tak přísného výběru proniknout, a to zejména pro malé obory.

Služba Essential Science Indicators (ESI), která funguje na platformě Web of Science, každé dva měsíce pro každý z těchto 22 ESI oborů a pro články za posledních 10 let vypočítává a aktualizuje minimální počet citací, které je nutné dosáhnout, aby byl článek do prvního procenta nejcitovanějších zařazen. Tyto limity vychází z oborové normalizace, tedy očekávané citovanosti pro daný rok, obor a typ článku, s výhradním zahrnutím výzkumných článků typu Article a Review. Aktuálně jsou v ESI zahrnuty články z let 2014 až 2024 a statistiky uvedené v tomto článku vychází z aktualizace z 13. března 2025. Tento přehled je proto spíše sondou do vybraného okamžiku existence citační sítě, protože počty citací se prakticky každým dnem mění.

ESI do svého výběru nezahrnuje obory Arts & Humanities kvůli jejich přirozeně nízké citovanosti. Naproti tomu, oborem ESI s nejvyšším citačním dopadem, tj. průměrným počtem citací na článek, je Molecular Biology & Genetics s téměř 29 citacemi na jeden článek. Clinical Medicine je se svými 37 512 highly cited články zase nejproduktivnější, následuje ji obor Engineering (23 907 článků) a Chemistry (22 413 článků). Clinical Medicine má současně i nejvyšší absolutní počet citací. Z toho vyplývá, že citační praxe mezi obory je různá, a proto i limit pro zařazení článku do prvního percentilu (1 % nejcitovanějších) znamená v různých oborech jinou hodnotu. Nejvyšší počet citací, které je nutné získat, aby byl článek z roku 2024 zařazen mezi vysoce citované, je 17 citací v oboru Materials Science a nejméně v oboru Mathematics (5 citací). U starších článků se tento minimální limit postupně zvyšuje, protože citace se kumulují.

Samostatnou kategorií, a co do počtu záznamů spíše minoritní, je kategorie Hot Papers. Ta reprezentuje články, u kterých došlo relativně rychle po jejich zveřejnění k raketovému nárůstu citací. Konkrétně, článek musí získat ve dvou měsících po zveřejnění takový počet citací, které jej zařadí do 0,1 procenta nejcitovanějších v oboru ESI. Pomocí indikátoru Hot Paper lze identifikovat výzkum na vysoce populární nebo žádaná témata, případně článek, který vzbudil okamžitý vědecký ohlas. Časové okno pro tyto příspěvky je však jen poslední dva roky a „hot“ články se počítají u nejproduktivnějších oborů v případě České republiky pouze na stovky záznamů. Velmi často se jedná o tytéž články, které jsou zároveň Highly Cited, proto se nejčastěji ve statistikách uvádí tyto dvě kategorie společně pod názvem Top Papers.

Jak si stojí česká věda

Co se týče zastoupení zemí, s obrovským odstupem oproti ostatním mají nejvíce vysoce citovaných článků USA (82 042 článků) a v relativně těsném závěsu Čína. Česká republika s počtem 2 367 Top Papers drží za celé sledované období 40. místo a předstihuje ji například Nový Zéland, Egypt i Turecko, které ovšem přibližně téhož počtu vysoce citovaných článků dosahuje v rámci skoro dvakrát většího zdrojového datasetu. Přesnější by proto bylo uvést počty Top Papers například do kontextu populace, tuto možnost však nástroj neposkytuje. Pozitivní přitom je, že trend je plynule stoupající, v posledních třech letech máme víc než jeden a půl krát více Top Papers než v období 2014–2018. Zajímavější ale bude podívat se podrobněji na to, které české články publikované v roce 2024 indikátor Top Paper naplňují.

Za rok 2024 se v databázi Web of Science nachází 269 článků s příznakem Top Paper publikovaných autory s afilací v České republice, z toho 34 Hot Papers a 268 Highly Cited Papers. Velké množství těchto českých zářezů však náleží vícenásobným afilacím, tedy situacím, kdy si autor uvádí adresu třeba až ke 4 či 5 institucím různě po světě. Stejný jev ovlivňuje i počet publikací s korespondenčním (hlavním nebo prvním) autorem z ČR, kterých je za rok 2024 celkem 49. Svou roli taktéž hraje velikost autorského kolektivu: 83 ze všech Top Papers publikoval autorský kolektiv s 30 a více autory a z toho 23 se 100 a více autory. V takových případech se na publikaci podílí často jedna osoba s alespoň jednou afiliací k tuzemské instituci. Z pohledu viditelnosti domácí vědy může být dále zajímavý pohled na to, kde čeští vědci výsledku dosáhli ve dvojstranné nebo třístranné spolupráci se zahraniční institucí na předních místech světových žebříčků. V datasetu jsou to například výsledky s úzkou spoluprací s California Institute of Technology, University of Edinburgh, Technical University of Denmark nebo Duke University.

Výzkum publikovaný v časopisu Journal of Informetrics prokázal, že studie publikované v mezinárodních týmech mají větší šanci na vyšší citovanost. Ostatně i proto zavedl Clarivate Analytics novou metriku Collab-CNCI, která váží citovanost počtem zapojených zemí. Naprostá většina vysoce citovaných článků České republiky pak vzešla z širší mezinárodní spolupráce. 269 Top Papers v roce 2024 má medián sedm zapojených zemí a 14 institucí. Počet zemí má však rozsah od 1 do 111 a počet institucí od 1 do 1 067. Tak vysoký počet institucí mohou zřejmě zajistit i duplicity v datovém poli Web of Science, ale počet 1 407 autorů ukazuje, že ani takové číslo nemusí být v zásadě nereálné.

Nejvyšší počet autorů dosahuje hodnoty 2 362, a to výzkum v oblasti částicové fyziky, publikovaný v časopise Physical Review Letters s účastí Miroslava a Michaela Fingerových a Martina Květoně z Univerzity Karlovy. Další příčky v počtu autorů obsazuje klinická medicína, ale dále i fyzika a astronomie. Poněkud neobvyklý je počet bezmála 350 autorů u článku z oblasti Business & Economics, ačkoli i v tomto oboru se publikační vzorec mění směrem k větším autorským kolektivům. Přestože se počet autorů u vysoce citovaných publikací pohybuje od jednoho do 2 362, mediánem mezi všemi Top Papers je 17 autorů na publikaci.

Jako ukazatel domácího know-how mezi vysoce citovanými články může sloužit zastoupení publikací s výhradně domácí proveniencí. Takových článků s ryze českými nebo ještě i slovenskými adresami je z 269 pouze 13. Se 49 citacemi je absolutně nejcitovanější ryze domácí publikací studie Marka Urbana z Psychologického ústavu Akademie věd v časopise Computers & Education o pozitivním vlivu využití ChatGPT na kvalitu, originalitu a kreativitu řešení úkolů zadaných experimentální skupině univerzitních studentů.

Výše uvedené majoritní vlastnosti datasetu, tedy převažující spolupráce větší skupiny autorů a oborové rozdíly v citovanosti, potvrzuje 581 citací článku o vlivu včasných zpráv o nemocnosti a zraněních populace, vydaného v květnu 2024 v časopise Lancet, což z něj dělá absolutně nejcitovanější práci v datasetu českých Top Papers roku 2024. Na článku se mezi celkovými 1328 autory z 85 zemí podíleli dva autoři z ČR. V rodině časopisu Lancet vyšly taktéž další tři v pořadí nejcitovanější články, všechny publikují výsledky jediné klinické studie z roku 2021. Na opačném pólu citovanosti vidíme práci Joonase Niinikoskiho z Univerzity Karlovy, které v ESI oboru Mathematics stačilo pro příznak highly cited pouhých pět citací. Výzkum z oblasti medicíny zaujímá prvních sedm příček nejcitovanějších článků a v dalším pořadí se promíchává s environmentálními vědami a fyzikou. To lze však považovat za očekávané vzhledem k citační intenzitě daných oborů. Celkově nejvíce vysoce citovaných prací spadá do klinické medicíny (91 článků), fyzikálních oborů (25) a biologie rostlin a živočichů (24 článků). Všechny společenské vědy dohromady čítají pouze 22 článků, a to z ekonomie (4), psychologie a psychiatrie (5) a obecných společenských věd (13). Jak naznačují názvy článků, i přes oborové zařazení se věnují výzkumu, který  tematicky spadá spíše k lékařským vědám.

Vysoce citovaní čeští vědci většinou potvrzují své prvenství

Vrátíme se na závěr opět k vědcům. Z letošního seznamu Highly Cited Researchers má v datasetu vysoce citovaných prací (Top Papers) za rok 2024 jednu publikaci v oboru mikrobiologie Petr Baldrian z Mikrobiologického ústavu AV ČR, dvě publikace Jan Pergl z Botanického ústavu AV ČR, a hned tři publikace fyzik Tomáš Jungwirth (Fyzikální ústav AV ČR), z nichž na jedné v časopise Nature figuruje i jako jeden z korespondenčních autorů. Rovněž tři články si započítal Vivek Y. Reddy z Nemocnice Na Homolce, který na všech třech publikacích figuruje jako korespondenční autor, avšak s vícenásobnou afilací mimo ČR. Ze stejné instituce má v seznamu vysoce citovaných své čtyři články Petr Neužil, z nichž tři sdílí s Vivekem Reddym a v pořadí autorů je s ohledem na zvyklosti v medicínských oborech zařazen také na čestných pozicích. Poslední dva z vědců, zařazených pro rok 2024 do seznamu Highly Cited Researchers s adresou v České republice, Petr Pyšek z Botanického ústavu AV ČR a Dmitry Chudakov z Masarykovy univerzity, nemají v loňských publikacích žádný Top Paper.

V minulosti jsme zaznamenali případy, kdy do seznamu vysoce citovaných publikací spadly práce, které své citace zjevně nabyly nekalým způsobem. Kdo se v analýze publikací již nějakou dobu pohybuje, dokáže na první pohled rozeznat potenciálně podezřelé jevy, například podle výskytu neočekávaných oborů a časopisů. V těchto případech se stalo, že vysokou čtenost zapříčinilo křížové citování mezi články jednoho nebo více časopisů se zjevným cílem editora citace uměle navýšit. Těžko říci, zda daní autoři přistoupili na tuto neetickou praxi záměrně, nebo z naivní neznalosti. Algoritmy Web of Science dokážou dnes tyto situace lépe odhalit. Přesto bychom neměli zapomínat, že bibliometrická data nelze slepě přejímat bez znalosti kontextu, bez zkušenosti a citlivosti vůči jejich případným nedostatkům.

  • Autor článku: ano
  • Zdroj: VědaVýzkum.cz
Kategorie: Analýzy