facebooktwittergoogleinstagram

Věda a výzkum

Portál Vědavýzkum.cz - Nezávislé informace o vědě a výzkumu

IOCB Tech, s.r.o. - hlavní partner portálu Vědavýzkum.cz

Hlavní partner portálu
facebooktwittergoogleinstagram

Analýza nejcitovanějších českých publikací od roku 1980 do současnosti

8. 1. 2024
Analýza nejcitovanějších českých publikací od roku 1980 do současnosti

V článku Technologického centra Praha, který vyšel v magazínu ECHO 4-5/2023, sledují, jak se během uplynulých čtyř desetiletí změnil charakter českých vědeckých publikací (tj. publikací, na nichž se podíleli čeští autoři), konkrétně jak se měnily jejich počet, citovanost, oborové zaměření, a k jakým změnám došlo z hlediska intenzity mezinárodní či průmyslové spolupráce při vzniku těchto publikací.

Zejména nás zajímaly změny u publikačních výstupů české vědní špičky a z tohoto důvodu jsme analyzovali nejen všechny české publikace vydané ve sledovaném období, ale i soubory 3 000 nejcitovanějších českých publikací (tzv. Topcit3000CZ) v jednotlivých dekádách sledovaného čtyřicetiletého období.

Citační impakt českých publikací se během sledovaných 40 let zvyšoval. TopCit3000CZ publikace z let 1980−89 měly průměrnou normalizovanou citovanost 6x vyšší (CNCI=2,6), než byl průměr všech českých publikací (CNCI=0,4) a publikace z let 2010−2019 dokonce 12x vyšší (CNCI=11,8), než byl celostátní průměr (CNCI=1,0). TopCit3000CZ publikace se liší od celostátního českého průměru také výrazně vyšší intenzitou mezinárodní (asi 2x vyšší) a průmyslové (asi 3x vyšší) spolupráce.

Rovněž oborové zaměření TopCit3000CZ publikací se liší od zaměření všech českých publikací a během analyzované periody se i odlišně vyvíjelo. U všech českých publikací nejrychleji stoupal podíl publikací z oborů elektroinženýrství a počítačových věd a sociálních věd, podíl publikací z oblasti fyzikálních věd stagnoval a naopak klesaly podíly publikací z oborů biomedicínských, chemických, a zemědělských a ekologických věd. U TopCit3000CZ publikací rychle rostly podíly publikací zaměřené na biomedicínu, elektroinženýrství a počítačové vědy, zemědělské, environmentální a ekologické vědy a sociální vědy. Mírně rostl i podíl publikací z fyzikálních věd. Naopak podíly publikací zaměřených na chemické a molekulárněbiologické obory v TopCit3000CZ výběrech během sledovaných 40 let klesaly.

Další zřejmou odlišností TopCit3000CZ publikací od celostátního českého průměru je značný podíl publikací s velkým počtem autorů a velmi rychlý růst průměrného počtu autorů během sledovaných čtyřiceti let. Je tedy zřejmé, že vývoj produkce ostatních českých publikací většinou nesleduje stejné trendy, jakými se mění ty nejcitovanější české publikace. Je otázkou, zda dochází k trvalé disociaci trendů mezi špičkou a celostátním průměrem, nebo jde pouze o dočasné zpoždění a tyto špičkové trendy budou časem následovat i všechny české publikace. My se domníváme, že jde spíše o tu druhou možnost.

Úvod a metodika

Politické změny v roce 1989 přinesly velmi rychle změny i do českého výzkumu a vývoje (VaV). Otevření se světu, velice usnadněná spolupráce s vyspělými vědeckými pracovišti v západních zemích, účast v rámcových programech EU a v neposlední řadě nové způsoby financování VaV byly změny, které výrazně ovlivnily styl a zaměření vědecké práce. Z těchto důvodů nás zajímalo, jak se během uplynulých čtyř desetiletí změnil charakter českých publikací, tj. publikací, které mají alespoň jednoho autora s afilací na pracovišti v České republice. Konkrétně: jak se měnily jejich počet, citovanost, oborové zaměření a k jakým změnám došlo z hlediska intenzity mezinárodní či průmyslové spolupráce při vzniku těchto publikací. Předmětem našeho zájmu byly změny publikačních výstupů u české vědecké špičky, proto jsme analyzovali nejen všechny české publikace vydané ve sledovaných časových obdobích od roku 1980, ale i soubor 3 000 nejcitovanějších českých publikací z těchto období.

Zaměřili jsme se na publikace, které vznikly ve čtyřech dekádách uplynulých čtyřiceti let, tj. v osmdesátých a devadesátých letech minulého století a nultých a desátých letech tohoto století. V každém desetiletí počínaje rokem 1980 jsme vybrali 3 000 českých publikací, které od svého publikování až do roku 2022 obdržely nejvíce citací (TopCit3000CZ). Tyto „TOP“ české publikace daného desetiletí jsme pak porovnávali nejen se všemi českými publikacemi vyprodukovanými v daném desetiletí (český průměr), ale také s TopCit3000CZ publikacemi z ostatních desetiletí. České publikace jsme vyhledávali ve Web of Science (WoS) v únoru a březnu 2023 a jejich statistický profil jsme pak zjišťovali prostřednictvím platformy InCites.

Výsledky analýzy

Celkový počet českých publikací během prvních dvou dekád stagnoval, poté následoval téměř dvounásobný růst v první dekádě 21. století a další téměř trojnásobný vzestup počtu publikací ve druhé dekádě tohoto století (graf 1). Ze všech českých publikací jsme v každé dekádě vybrali přibližně 3 000 publikací, které do roku 2022 získaly nejvíce citací.

graf1

Graf1: Vývoj počtu českých publikací vyprodukovaných během čtyř desetiletí od roku 1980 do roku 2019 

Poznámka: Zobrazeny jsou počty všech českých publikací (CZ total) a 3 000 nejcitovanějších českých publikací z daného desetiletí (Topcit3000CZ).

Zdroj: WoS/InCites 02–03/2023, vlastní zpracování

Rozdíly v průměrném počtu citací na jednu publikaci, u 3 000 nejcitovanějších českých publikací (TopCit3000CZ ) a u všech českých publikací vzniklých v dané dekádě ukazuje horní část grafu 2. Všechny české publikace vydané v letech 1980–89 byly (za těch přibližně 40 let) citovány v průměru sedmkrát a u publikací vydaných v dalších dvou dekádách vzrostl počet citací až na 14, resp. 21. U českých publikací vzniklých v poslední analyzované dekádě (2010–2019) však byl průměrný počet citací na jednu publikaci nižší než u publikací z dekády předešlé. To je zřejmě způsobeno mnohem kratší dobou, po kterou mohly tyto novější publikace citace získávat (tj. jen od 3 do maximálně 13 let).

Publikace TopCit3000CZ však byly citovány mnohem více: publikace z osmdesátých let byly v průměru citovány (za přibližně 40 let) celkem 63×, publikace z let devadesátých celkem 113× a publikace z let 2000 až 2009 dokonce 243×. TopCit3000CZ publikace vydané v poslední sledované dekádě (2010−2019) získaly v průměru dokonce ještě více citací (309), než publikace z předchozí dekády, a to i přesto, že od jejich vzniku uplynul pouze krátký čas. U publikací vzniklých v letech 1980–89 a 1990–99 byly rozdíly v citovanosti mezi všemi českými publikacemi a TopCit3000CZ publikacemi osmi- až devítinásobné, u publikací vzniklých v letech 2000−2009 asi jedenáctinásobné a u těch z let 2010–2019 dokonce více než dvacetinásobné. Je tedy vidět, že se rozdíly v citačním impaktu mezi všemi českými a TopCit3000CZ publikacemi postupně zvětšují a v poslední dekádě vzrostly zdaleka nejvíce. Rovněž je zřejmé, že se citovanost těchto špičkových českých publikací zvyšuje mnohem rychleji, než je tomu u ostatních českých publikací.

Podobné závěry lze učinit i po přepočtení citací na CNCI (normalizovaný citační index, tj. citovanost, která byla normalizovaná nejen na oborové rozdíly, ale i na rozdíly v datu publikace a druhu publikace, viz dolní část grafu 2). V důsledku časové normalizace lze přímo srovnávat CNCI publikací vydaných v různých letech. CNCI během 4 dekád vzrostla u všech českých publikací 2,5× (z 0,4 na 1,0) a u špičkových českých publikací téměř 5× (z 2,6 na 11,8). U TopCit3000CZ publikací byl tedy růst CNCI asi dvakrát rychlejší.

graf2

GRAF 2: Změny v průměrném počtu citací na jednu publikaci (nahoře) a CNCI (dole) u českých publikací během čtyř desetiletí od roku 1980

Poznámka: Srovnání mezi všemi českými publikacemi (CZ total) a 3 000 nejcitovanějšími publikacemi z daného desetiletí (Topcit3000CZ).

Zdroj: WoS/InCites 02–03/2023, vlastní zpracování

TopCit3000CZ publikace mají víc než dvakrát vyšší intenzitu mezinárodní spolupráce než ostatní české publikace (graf 3 nahoře). Více než 70 % publikací vydaných po roce 2000, a dokonce 87 % publikací vydaných od roku 2010, vzniklo ve spolupráci se zahraničními pracovišti. Český průměr byl mnohem nižší, u publikací vydaných v letech 2010−19 jich vzniklo ve spolupráci se zahraničními pracovišti pouze 41 %.

Rovněž intenzita spolupráce s firemním VaV (tj. s průmyslovými podniky) je 3× až 4× vyšší u TopCit3000CZ publikací, než u ostatních českých publikací (graf 3 dole). V letech 2010−19 vzniklo téměř 12 % těchto publikací ve spolupráci s firmami, kdežto český průměr byl 3 %. Je tedy zřejmé, že mezinárodní i firemní spolupráce významně přispívá k vysoké citovanosti českých publikací.

graf3

GRAF 3: Změny v intenzitě mezinárodní spolupráce (naoře) a spolupráce s průmyslem (dole) u českých publikací vyprodukovaných během čtyř desetiletí od roku 1980

Poznámka: Srovnání mezi všemi českými publikacemi z daného období (CZ total) a 3 000 nejcitovanějšími českými publikacemi (Topcit3000CZ) z tohoto období.

Zdroj: WoS/InCites 02–03/2023, vlastní zpracování

Dalším evidentním trendem je postupný růst počtu autorů podílejících se na českých publikacích (graf 4). U TopCit3000CZ publikací došlo během sledovaných čtyř desítek let k výraznému nárůstu podílu publikací s počtem autorů vyšším než deset (graf 4 nahoře). V letech 1980 až 89 mělo téměř 99 % publikací nejvýše 10 autorů, přičemž téměř 83 % z nich mělo nejvýše 4 autory. V letech 2010–19 mělo do 10 autorů pouhých 44 % publikací, 7 % publikací jich mělo více než 300 a 3 % publikací jich mělo dokonce více než tisíc. U všech českých publikací rovněž během sledovaných čtyřiceti let roste počet autorů podílejících se na publikaci, ale růst je pomalejší a publikace s počtem autorů vyšším než 300 se dosud objevují skutečně ojediněle – výskyt v letech 2010−19 nepřesáhl 0,9 procent (graf 4 dole).

Publikace s velmi vysokým počtem autorů (tj. vyšším než 300) patří převážně do fyzikálních věd (hlavně obory: Particles & Fields, Nuclear Fusion, Astronomy & Astrophysics, Space Sciences) či v menším počtu případů do biomedicínských oborů (hlavně obory: Diabetes, Medical Physics, Cardiac Arrhythmia, Lipids, Allergy, Antibiotics & Antimicrobials). V těchto oborech je široká spolupráce velkou výhodou, a proto je stále častější. V ostatních vědách (Agriculture, Environment & Ecology, Chemistry, Engineering & Materials Science, Electrical Engineering, Electronics & Computer Science, Earth Sciences) se vyskytují vysoké počty autorů spíše ojediněle.

graf4

GRAF 4: Změny v počtech autorů uvedených u 3 000 nejcitovanějších českých publikací (Horní graf) a všech českých publikací (Dolní graf)

Zdroj: WoS/InCites 02–03/2023, vlastní zpracování

TopCit3000CZ publikace z let 1980–89 patří nejčastěji do chemických oborů (38 % publikací), od roku 1990 však tyto publikace nejčastěji náleží do biomedicínských oborů (graf 5 nahoře). Další obory, do kterých TopCit3000CZ publikace často patří, jsou zemědělské a ekologické obory nebo fyzikální vědy. Tyto 4 obory tvoří také největší podíl všech českých publikací (graf 5 dole).

Zajímavé jsou však relativní změny v podílu publikací z různých oborů během sledovaného období. Ve výběru TopCit3000CZ publikací rostl během 4 desítek let nejrychleji podíl publikací z oborů biomedicína, zemědělské a ekologické vědy, fyzikální vědy, elektroinženýrství a počítačové vědy a sociální vědy. Naopak podíly publikací z oborů chemie, inženýrské a materiálové vědy či matematika ve výběru TopCit3000CZ postupem času klesaly.

U ostatních českých publikací byly však trendy (tj. časové změny) poněkud odlišné. Nejrychleji stoupal podíl publikací z oborů elektroinženýrství a počítačových věd a sociálních věd. Poněkud pomaleji stoupal podíl publikací z inženýrských a materiálových věd, věd o zemi a uměleckých a humanitních věd (v těch posledních ale jen málo a na velmi nízkých absolutních počtech). Naopak klesaly podíly v oborech biomedicínských, chemických a zemědělských a ekologických věd.

graf5

GRAF 5: Změny v oborovém zaměření u 3000 nejcitovanějších (nahoře) a průměrných českých publikací (dole) během čtyř desetiletí od roku 1980

Poznámka: Citace byly počítány od data publikace až do roku 2022. Zdroj: WoS/InCites 02–03/2023, vlastní zpracování

Je tedy zřejmé, že vývoj produkce ostatních českých publikací většinou nesleduje stejné trendy, jakými se mění ty nejcitovanější české publikace. I když pokles četnosti publikací v chemických vědách, a naopak vzestup počtu publikací v elektro-inženýrství a počítačových vědách a v sociálních vědách, se shodně objevuje u těch nejcitovanějších i u průměrných českých publikací. V biomedicíně, zemědělských a ekologických oborech, a z části i ve fyzikálních vědách, je vývoj počtu publikací u těch nejcitovanějších a u ostatních českých publikací spíše odlišný.
Na závěr doplňujeme ještě ukázku 7 českých publikací z let 1980– 2019, které do roku 2022 získaly vůbec nejvyšší počet citací (tabulka 1). Jediná z nich získala více než 10 tisíc citací, ty další jich získaly od 5 do téměř 9 tisíc. Šest z nich bylo z medicínských oborů a jedna z pomezí fyziky a chemie. Mezi těmito absolutně nejcitovanějšími publikacemi je jen jedna, u níž počet autorů přesahuje 300.

Diskuse a závěry

Celkový počet českých publikací vzrostl během čtyřiceti let víc než 4×, jejich normalizovaná citovanost (CNCI) v průměru 2,5×. Výběr nejcitovanějších publikací (TopCit3000CZ ) z let 1980–89 měl průměrnou normalizovanou citovanost 6× vyšší než český průměr (CNCI=2,6) a těch z let 2010–19 dokonce 12× vyšší než průměr (CNCI=11,8). TopCit3000CZ publikace se liší od českého průměru také výrazně vyšší intenzitou mezinárodní (asi 2× vyšší) a průmyslové (asi 3× vyšší) spolupráce. Potvrzuje se tedy hypotéza, že mezinárodní spolupráce přispívá k vysoké citovanosti (Narin et al. 1991; van Raan 1998; Glanzel and Schubert 2001; Aksnes 2003). Totéž může platit i o firemní spolupráci.

Další zřejmou odlišností TopCit3000CZ publikací od českého průměru je značný podíl publikací s velkým počtem autorů a velmi rychlý růst počtu autorů během sledovaných čtyřiceti let. V letech 1980–89 mělo téměř 99 % nejcitovanějších publikací nejvýše 10 autorů, kdežto v letech 2010–19 mělo méně než 10 autorů pouhých 44 % publikací a 7 % publikací jich mělo více než 300 a 3 % jich mělo dokonce více než tisíc. Tyto multiautorské publikace patřily převážně do fyzikálních, případně biomedicínských oborů. Zde je široká spolupráce zřejmě velkou výhodou, a proto je stále častější.

Během 40 let se změnilo i oborové složení TopCit3000CZ publikací. V letech 1980–89 patřilo téměř 38 % z nich do chemických věd, kdežto v letech 2010–19 to bylo už jen necelých 14 % a největší podíl těchto publikací (víc než 41 %) spadal do biomedicínských věd (a z nich nejvíce do klinické medicíny a onkologie). Rychle rostly i podíly publikací zaměřených na elektroinženýrství a počítačové vědy, zemědělské, environmentální a ekologické vědy a sociální vědy. Mírně rostl i podíl publikací z fyzikálních věd. Naopak podíly publikací zaměřených na chemické a molekulárněbiologické obory ve výběrech TopCit3000CZ publikací během sledovaných 40 let klesaly.

tabulka

TABULKA 1: Nejcitovanější české publikace z let 1980–2019

U českého průměru nejrychleji stoupal podíl publikací z oborů elektroinženýrství a počítačových věd a sociálních věd, podíl fyzikálních publikací stagnoval a naopak klesaly podíly publikací z oborů biomedicínských, chemických a zemědělských a ekologických věd.

Je známo, že ve starých členských zemích EU a v USA dlouhodobě mají největší podíl publikace z medicínských a biologicko-ekologických věd, kdežto v zemích východního bloku tvořily v osmdesátých letech 20. století největší podíl publikace z oboru chemických a fyzikálních věd (Kozlowski a spol., 1999). To původně platilo i pro ČR (Vaněček 2008), ale je vidět, že se česká produkce publikací postupně přizpůsobuje západním trendům. Příčiny tohoto přizpůsobování přesně neznáme. Roli může hrát mezinárodní spolupráce, větší atraktivita biomedicínských oborů nebo víc příležitostí pro získání financování výzkumných projektů-grantů v těchto oborech. Je ale jasné, že pokud v celkové produkci roste podíl publikací z daného oboru, tak se pravděpodobně zvýší i jejich podíl mezi nejcitovanějšími publikacemi (expanze zdola nahoru). Je však možné uvažovat i o opačném směru šíření (shora dolů): čas od času se mění obory, ve kterých se v daném období odehrává nejrychlejší vývoj či pokrok. To může být podmíněno vývojem poznání a zdokonalováním technických prostředků, které pak dovolí rychlý a převratný pokrok v daných oborech. V těchto rychle se vyvíjejících oborech jsou publikace natolik zajímavé pro širokou vědní komunitu, že jsou více citovány, a proto se později do nich přesunují i další výzkumníci. V důsledku stoupá počet takto zaměřených publikací i v průměrné celostátní produkci. Oborová změna u nejcitovanějších publikací by však v tomto případě předcházela změnu u průměru.

Některé z našich výsledků zřejmě podporují spíše tento druhý mechanismus. U TopCit3000CZ roste podíl biomedicínských publikací mnohem rychleji a podíl publikací z chemických věd klesá rychleji než u českého průměru. ČR si však zachovává určitá specifika: podíl publikací z fyzikálních věd stagnuje na poměrně vysokých hodnotách či dokonce mírně stoupá, a to jak u průměrných českých publikací, tak u TopCit3000CZ.

Je zřejmé, že vývoj (tj. trend) TopCit3000CZ publikací směřuje v řadě aspektů jinam, než je tomu u českého průměru, nebo že u nich změny přicházejí mnohem rychleji než u průměru. Tuto disociaci mezi TopCit3000CZ a celostátním českým průměrem pozorujeme v citovanosti (CNCI), v intenzitě mezinárodní a průmyslové spolupráce, v oborovém zaměření a v rychlém přibývání počtu autorů účastnících se na vzniku publikace. Některé z těchto odlišností mohou být onou primární příčinou, proč jsou TopCit3000CZ publikace citovány mnohem více než celostátní český průměr. O mezinárodní spolupráci je dobře známo, že zvyšuje citovanost (Narin et al. 1991; van Raan 1998; Glanzel and Schubert 2001; Aksnes 2003), i když mechanismus zcela objasněn není. Rovněž počet autorů v některých analýzách pozitivně koreloval s počtem citací (Gazni & Didegah 2011).

Je tedy možné, že změny u TopCit3000CZ publikací mohou ukazovat směr vývoje, který budou po čase následovat i ostatní české publikace, a to jak v oborovém zaměření, tak i v rostoucím počtu autorů podílejících se na vzniku jedné publikace. Vysoký počet autorů je zatím častější pouze v určitých oborech, ve kterých je skupinový nápor výhodný nebo i nutný: částicová fyzika, astronomie, vývoj a testování léčiv či léčebných postupů atd. Dosažení pokroku v těchto oborech totiž často vyžaduje velmi nákladné a složité technické vybavení, nebo multioborový přístup či obé. Proto se kolem tohoto vybavení soustředí početná vědecká komunita, která posléze publikuje společné výsledky. Je ale též možné, že tento trend časem zachvátí i ostatní vědní obory a bude pak představovat mainstream. Tento nátlakový přístup k řešení problémů zahrnující odborníky z mnoha oborů a vysoké nasazení téměř vylučuje roli náhody (či štěstí) v dosažení úspěchu, které jsou (nebo byly) tak důležité u klasického vyhledávacího výzkumu. Takovýto komplexní a intenzivní přístup je už dnes poměrně typický pro průmyslový (firemní) výzkum (např. farmaceutický). Je proto možné, že to, co zatím pozorujeme jen zřídka u těch nejcitovanějších publikací, naznačuje budoucí vývoj ve stylu vědecké práce: vysoký počet autorů znamená přechod od vyhledávacího výzkumu, ve kterém hraje významnou úlohu náhoda, k systematickému a nátlakovému výzkumu, který byl do nedávné doby doménou spíše průmyslového výzkumu a vývoje.

 

Autor: Jiří Vaněček, Daniel Frank

Zdroj: Technologické centrum Praha

Text v plném znění včetně poznámek a zdrojů naleznete v  časopise ECHO (4-5/ 2023), který vydává Technologické centrum Praha.