facebooktwittergoogleinstagram

Věda a výzkum

Portál Vědavýzkum.cz - Nezávislé informace o vědě a výzkumu

IOCB Tech, s.r.o. - hlavní partner portálu Vědavýzkum.cz

Hlavní partner portálu
facebooktwittergoogleinstagram

Jan Šedivý: Umělá inteligence Alquist dokáže mluvit téměř o čemkoli

30. 3. 2023
Jan Šedivý: Umělá inteligence Alquist dokáže mluvit téměř o čemkoli

Alquist není jen jméno jedné z hlavních postav ze slavného utopického dramatu R. U.R. Karla Čapka, ve kterém se historicky poprvé objevilo slovo robot, ale i název chatbota z dílny Jana Šedivého a jeho týmu z ČVUT. S ním jsme hovořili nejen o oblastech, ve kterých má jak Alquist a umělá inteligence své místo, ale i například o ochraně osobních informací a humoru v kontextu umělé inteligence.

Jan Sedivy zdroj Jiri Ryszawy 1

V roce 2017, tedy pouhý rok po první verzi zmíněné technologie (jehož pracovní název zněl Alquist I. Hloupý), byl Alquist zařazen spolu s dalšími dvanácti projekty do soutěže Alexa Prize pořádané Amazonem. Zde se tým, jehož lídr Jan Pichl uspěl ve známém žebříčku českého Forbesu 30 pod 30, umístil na druhém místě. Celý tým Alquist byl na stupních vítězů již čtyřikrát – v roce 2017 byl druhý, v roce 2018 byl také druhý, v roce 2019 byl třetí a ve čtvrtém kole soutěže Alexa Prize se v roce 2021 umístil na prvním místě. Momentálně soutěží v 5. kole Alexa Prize SocialBot Grand Challenge.

Vyvíjíme aplikace, které pomáhají překonat úzkost a stres

V jakých oblastech lze využít chatbota Alquist? V minulosti jste zmiňoval například oblast duševních poruch, ve které by Alquist pacientům pomocí cvičení pomohl minimalizovat dopady onemocnění. Dočkal se Váš vývoj v tomto segmentu významnějšího posunu?

Na oblast, kterou zmiňujete, se zaměřil v počátcích vývoje startup Promethist.ai. Rádi bychom v tomto směru pokračovali – měli jsme v plánu cílit na pacienty, kteří mají například problémy s motorikou nebo na pacienty postižené Alzheimerovou chorobou, jimž by pomohla cvičení spojená s pamětí – ale v praxi se ukázalo, že pro tyto uživatele je ovládání aplikace po technické stránce velmi obtížné. Přesněji řečeno: hlavní překážkou se ukázalo být nejen ovládání samotné aplikace, ale i vlivy technického charakteru, jako je vypadávání wifi sítě a podobně.

Rozhodně nevylučujeme návrat k této oblasti, ale segment, na který se aktuálně zaměřujeme a jenž lze pokládat za vyústění předchozího vývoje, se nazývá well-being. Promethist.ai vyvíjí aplikace, které pomáhají při stresových situacích, úzkostech a dalších životních epizodách, jež mohou ohrozit psychické zdraví jednotlivce. Za tímto účelem máme v týmu řadu psychologů, kteří mají na starost vyvíjet reakce avatarů, se kterými si uživatel povídá. Tyto figurky, které jsou v nejrozšířenější aplikaci Elysai, zpřístupňují aplikaci uživatelům a jsou jedním z prvků, díky kterým uživatelé udržují s aplikací dlouhodobější kontakt.

Lze postupy a technologii ze segmentu well-being uplatnit i v některých dalších oblastech?

Ano, určitě, poznatky a postupy budeme aplikovat i v aplikacích, jež slouží ke komunikaci se zákazníky ve větších korporacích a podobně. V této oblasti se boty již používají, ale moc toho neumí a většinou pouze propojí zájemce s agentem z call centra. Možnosti a potenciál tedy jsou. Naše stroje dovedou zpracovat a mluvit o obrovském množství témat. Kdybych řekl, že dokážou mluvit o čemkoli, nebyl bych daleko od pravdy.

Jaký je vývoj chatbotů v segmentu automotive?

V této oblast mají chatboty už své místo jisté, už i levné automobily mají rozpoznávání řeči. Důvod je nasnadě – při řízení máte zaměstnané ruce. Sám jsem se v roce 1995 podílel na prvním rozpoznávání řeči do auta. Tehdejší rozpoznávače byly mnohem jednodušší oproti složitějším systémům, které existují dnes. Infotainmenty s rozpoznáváním řeči v autech poněkud zaostávají a v autech se proto začínají prosazovat modifikované inteligentní boty, jako je například Alexa, Siri od Apple, Google Hub apod.

Pokud vynecháme právě úspěšný textový ChatGPT, dočkáme se v blízké budoucnosti rozšíření voicebotů interagujících s uživateli v češtině?

Nejedná se ani tak o technický problém – implementace češtiny by měla jít bez problému, ale o problém v oblasti trhu, tedy percepce a marketingu. Firmy jako Apple, Google, Microsoft či Amazon si českého trhu příliš nevšímají. Jako Česko pro ně nejsme příliš atraktivní, aby do nás tito giganti investovali.

V oblasti ochrany dat by měl uživatel k chatbotu přistupovat s jistou obezřetností

Ve zmíněných oblastech – well-being a automotive – je možné o uživateli nashromáždit velké množství osobních dat. Jak se stavíte ke „sběru“ osobních informací o uživateli, které si Alquist či další chatboty pamatují?

Pokud bychom omezili paměť stroje v našem vyhledávání a nedošlo by ke shromažďování osobních informací o uživateli, automaticky bychom tak snížili kvalitu dalšího vyhledávání. Pro uživatele v případě dialogu s AI paměť vylepšuje komunikaci. V případě, že například umělé inteligenci oznámíte, že jste dnes sledoval svůj oblíbený seriál se svou sestrou, umělá inteligence si z této věty zapamatuje aktivitu – sledování seriálu – a fakt, že máte sestru. V dalším rozhovoru se tak AI od zmíněných informací může „odpíchnout“ a konverzaci dále rozvíjet. Dialog je složitý, čeká nás ještě hodně práce. Pokud se někdy ve veřejné dopravě zaposloucháte, jak lidé mluví při telefonování, zjistíte, že nevíte, o čem mluví. Je zde totiž něco zapotřebí, něco podstatného, a to je kontext. Ten je nutný k tomu, aby stroj dokázal uživateli lépe pomoci a aby komunikace šla hladce.

Jak se v tomto ohledu stavíte k ochraně těchto informací a jejich možnému zneužití?

To je těžká otázka. V oblasti ochrany dat by měl uživatel k chatbotu přistupovat s obezřetností. Pokud mluvíte s někým, koho neznáte, nebudete mu sdělovat heslo do internet bankingu. V životě ale není nic zcela bez rizika. Když přecházíte ulici, může vás přejet auto, ale vy přitom dáváte pozor. Když s někým mluvíte, musíte také dávat pozor. Riziko představují fake news, kyber šikana atd.

Umělá inteligence stejně jako všechny nové technologie přináší nejen nové možnosti, ale i nová rizika. Internet je nové médium a oproti například knihtisku umožňuje velmi rychle šířit informace po celém světě. Není divu, že možnostmi, které poskytuje, dokáže přilákat řadu šmejdů, kteří se jej snaží zneužít. Z hlediska bezpečnosti a rizik zde lze spatřit paralelu například s automobily. V tomto směru trvalo delší dobu, než se jízda začala regulovat prostřednictvím semaforů a značek, které měly zamezit úmrtí na silnici. I tak si autohavárie každoročně vyžádají stovky mrtvých. Tím chci pouze říct, že vše je relativní. Nebezpečí tedy nelze vyloučit, tak jako ve výše zmíněných oblastech.

Alquist Team 2023 zdroj Jiri Ryszawy

Aktuální tým chatbotu Alquist

Nekorektním výrokům, které jsou urážlivé na základě obsahu, se nelze vyhnout

V minulosti jste zmínil, že chatbot Alquist dokáže klasifikovat věty (oznamovací, rozkazovací a tázací). Dokáže tedy rozeznat i sarkasmus a „sofistikovanější“ formu humoru?

Ano, výzkumníci pracují na klasifikátorech i generátorech sarkasmů. Jejich přesnost je však aktuálně o trochu více než padesát procent, tedy jako kdybyste si hodil korunou. Problém je, že stroj nemá inovativní myšlení. Pokud tedy chatbotu přikážete, aby řekl vtip, tak nějaký vybere z databáze vtipů, kterými byl natrénován. Ale humor, v lidské konverzaci, vyplyne ze samotné situace a je založený na asociacích, které jsou bezprostřední a nečekané. Chatbot tohoto úkonu není schopný, dokáže se pouze zpětně probírat v paměti.

Skýtá humor pro chatboty, jako je Alquist, úskalí a problémy? Od vulgarismů po výroky, které mohou vyznít nekorektně?

Aby se chatbot vyvaroval vulgarismům, stačí zkrátka vytvořit blacklist, seznam sprostých slov, a kontrolovat, aby se žádné z nich nedostalo do reproduktoru. Větší problém je uhlídat nekorektní výroky z hlediska obsahu.

K tomu se vztahuje i jedna nemilá příhoda, kterou jsme zažili. Jednoho dne před Vánocemi se pracovníci Amazonu rozhodli, že našeho chatbota představí dětem zaměstnanců. Děti se s Alquistem bavily, když v jednom okamžiku bot pronesl výrok: „Santa is dead.“ To samozřejmě představovalo velký problém, ale těmto nekorektním výrokům, které jsou urážlivé na základě obsahu, je zatím velmi těžké se vyhnout.

Obsah věty dále můžete posoudit pouze v tom případě, že nad ním přemýšlíte. Těchto konsekvencí je navíc mnoho. Zejména v případě angličtiny, kde je mnohem více případů přeneseného významu slov nebo vět než v češtině. Pokud nežijete v dané kultuře, detekce je obtížná, a to nejen pro chatboty, ale i pro cizince.

 

Autor: Vědavýzkum.cz (JM)

Foto: Jiří Ryszawý, ČVUT v Praze


Jan Šedivý

Jan Šedivý působí na Českém institutu informatiky, robotiky a kybernetiky od roku 2016 jako vedoucí skupiny Big Data and Cloud Computing. V minulosti pracoval pro společnost Google jako Technical Lead Manager a v institutu IBM T. J. Watson Research Center jako člen výzkumného týmu a později vedoucí výzkumu. Vedl mnoho celosvětových výzkumů a vývojářských projektů, byl hlavním designerem aplikace IBM Embedded ViaVoice pro rozpoznávání řeči. V této oblasti získal celou řadu ocenění a je autorem mnoha patentů.

Specializuje se na výzkum konverzační umělé inteligence a interakce mezi lidmi a roboty, navíc vede vědecký inkubátor ČVUT eClub pro nadané studenty. Z něj rovněž vzešel studentský tým Alquist, který se svým stejnojmenným social botem získal v minulém roce zlatou medaili v mezinárodní soutěži Amazonu Alexa Prize. Kromě toho je Jan Šedivý spoluzakladatelem startupu PromethistAI, vyvíjejícího vlastní konverzační aplikace, kde zastává pozici Senior Scientific Advisor.