Věda, která se dělá v České republice, má často mezinárodní ohlas. České mozky bodují v mnoha oborech, tradičně také v umělé inteligenci (AI). Za zmínku stojí dva nedávné úspěchy, které zaznamenali na Fakultě informačních technologií Vysokéhoučení technického v Brně a Fakultě elektrotechnické Českého vysokého učení technického v Praze. Oba týmy patří právem mezi světové jedničky.
Oblast rozpoznávání řeči na VUT je na absolutní špičce
Vysoké učení technické v Brně se objevilo na žebříčku podle Arnet Miner v oblasti „Speech recognition“ v první pětici institucí, které ovládají oblast dolování informací z řeči. A je to jediný pomyslný zářez České republiky. Na žebříčku dominuje VUT společně se společnostmi Google, Facebook, Carnegie Mellon University nebo IBM. Tento úspěch má na svém kontě skupina BUT Speech@FIT, kterou vede Jan Černocký z Ústavu počítačové grafiky a multimédií na Fakultě informačních technologií. Vědeckým ředitelem skupiny je Lukáš Burget. Spolu s Černockým a ještě dalším členem skupiny Pavlem Matějkou jsou zařazeni do seznamu stovky nejvlivnějších světových výzkumníků v oblasti rozpoznání řeči.
Tým BUT Speech@FIT
V žebříčku nejúspěšnějších vědců v oblasti umělé inteligence napříč kategoriemi se v první stovce umístil také Tomáš Mikolov, který je absolventem VUT. Nyní působí na CIIRC ČVUT. Má za sebou kariéru ve společnostech Google, Microsoft i Facebook.
Nicméně kromě umístění v žebříčku bodovala skupina BUT Speech@FIT za posledního půl roku na mnoha dalších mezinárodních soutěžích. Jedná se o „challenges“, kde jsou všem týmům k disposici stejná data, stejné podmínky a výsledky se vyhodnocují podle známé metodiky. Je v nich tedy možné se objektivně srovnat s ostatními světovými laboratořemi. Z početné konkurence soutěžících týmů se umístili na 2. místě v NIST Open Speech Analytic Technologies, kde se soutěžilo v přepisu řeči z velmi složitých prostředí. Dalším úspěchem bylo 2. místo VUT v VoxCeleb Speaker Recognition Challenge 2020 v kategorii diarizace (určení, kdo v rozhovoru kdy mluví). 3. místo obsadil systém VUT v soutěži Efficient QA na konferenci NeurIPS (zodpovídání dotazů).
„Úspěch v žebříčku nás těší, ale hodnocení může být trochu subjektivní. My více slavíme při umístění na mezinárodní soutěži. Dostaneme zadaný úkol, tedy zvukový soubor řeči, z kterého dolujeme informace,“ vysvětluje skromně Černocký, jehož skupina konkuruje světovým hráčům v poli AI a často vyhrává.
Dolování informací z řeči, které se dělá tým Černockého, není pouhé přepisování slov. Rozborem dat z řeči můžeme dostat i klíčová slova, pohlaví nebo věk – v těchto doménách lze úlohu dobře nadefinovat a korektně přepsat trénovací data. Pomocí AI lze detekovat i emoce mluvčího nebo úroveň vzdělání a další. Tady se ale AI potýká s nepřesnými daty – ani lidé si leckdy nejsou jistí.
„Já jsem na Fakultě informačních technologií skoro od jejího vzniku. Sešla se tady dobrá parta nadšených odborníků a zároveň jsme dobře zapadli do toho, co už se na vznikající fakultě dělalo. V mé skupině je dnes deset různých národností a hodně spolupracujeme se zahraničními partnery. Máme za to, že když budeme otevření – ať už v publikacích, open-source softwaru nebo právě v práci s kolegy a kolegyněmi z celého světa, vyplatí se to. A zatím to klape,“ usmívá se Černocký nad tím, v čem je skupina unikátní a co jí přináší tah na branku.
Černocký říká, že na to, jak jsme maličká země, je pozice jeho oboru velmi silná. V mezinárodní komunitě se ví, že „speech“ se dělá v USA, Číně … a v Česku. Řeč je ale jen jedno z odvětví AI, která byla podle Černockého ještě přibližně před deseti lety velmi rozdrobená – každé mělo své techniky nesrozumitelné pro „ty druhé“. To se změnilo díky neuronovým sítím a hlubokému učení – díky tomu se jednotlivé obory přiblížily, odborníci mezi sebou začali více komunikovat a celý obor to neskutečně „nakoplo“, takže experti na řeč, počítačovou lingvistiku nebo počítačové vidění dokáží mezi sebou sdílet zkušenosti.
„Protože je v České republice velká základna v AI, bodujeme a jsme hodně vidět v zahraničí. Přijde mi, že u nás to lidé zatím nevidí. To je škoda, protože si myslím, že si zasloužíme větší pozornost třeba ministerstev nebo grantových agentur. AI patří mezi významné vědecké obory v České republice. A nejenom v Brně,“ doplňuje Černocký, vyjmenovává další vynikající pracoviště v Plzni, Liberci, Ostravě a v Praze a zmiňuje také iniciativu AI Czechia, která se snaží umělou inteligenci v Česku propagovat.
Vědci z ČVUT bodovali v Amazon Research Awards
Výzkum AI na Fakultě elektrotechnické ČVUT v Praze se umístil v prestižním Amazon Research Awards. Projekty byly hodnoceny z hlediska vědy, kreativity a potenciálu ovlivnit společnost. Amazon poskytuje vítězům finanční prostředky na výzkum po dobu jednoho roku. Mezi 101 vědci oceněnými společností Amazon figurují kybernetik Jiří Matas z Katedry kybernetiky s projektem v oblasti počítačového vidění a kybernetik Jan Faigl z Katedry počítačů, který využívá AI k vytváření komunikačních map podzemních prostor.
Jiří Matas a Jan Fajgl (Foto: FEL ČVUT)
Jiří Matas se zaměřuje na zkvalitňování úrovně počítačového vidění. V Amazon Research Award 2020 uspěl s projektem Training neural networks on non-differentiable losses. Řešení tohoto projektu může přispět ke zlepšení kvality mobilních aplikací. Například pomocí mobilního fotoaparátu se vyfotografují a následně přeloží cizojazyčné texty na cedulích nebo se prověří nutriční hodnoty uvedené na obalu výrobků v kamenných prodejnách.
„První výsledky ve výzkumu daného problému už máme, byly publikovány na jedné z nejprestižnějších konferencí v oboru, European Conference on Computer Vision,“ vysvětluje Matas.
Jan Faigl uspěl s projektem Communication Maps Building in Subterranean Environments, který zkoumá využití metod strojového učení v úloze charakterizace šíření signálu v podzemních prostorech. Výzkum je motivovaný online vytvářením komunikační infrastruktury v dopředu neznámém prostředí, ale s využitím modelů podobných prostředí a dat získaných v aktuálním prostředí.
Fajgl vysvětluje využití projektu v praxi: „Snažíme se navrhnout metody zajištění komunikační dostupnosti během průzkumných misí v neznámém prostředí. Tím přispějeme k efektivní koordinaci týmu robotů nebo lidských záchranářů v prostředí, která jsou jinak komunikačně nedostupná.“
Autor: Vědavýzkum.cz (ED)
Zdroj: Arnet Miner, VUT (1, 2), ČVUT, Amazon Science
- Autor článku: ne
- Zdroj: Vědavýzkum.cz