
AI technologie vyvinutá lingvisty na Univerzitě Palackého v Olomouci a uvedená v praxi ve spolupráci se softwarovou firmou Relspeek umí identifikovat a napodobit styl mluvy konkrétního člověka a zakrýt svůj AI původ. Může pomoci odhalit autora anonymních nenávistných příspěvků či komentářů falešných profilů na sociálních sítích, ale i vytvořit personalizované sdělení například v reklamě či informační nebo volební kampani.
Jazyk jako otisk prstu
Většina současných jazykových modelů funguje na principu statistických pravděpodobností – předpovídají, která slova budou s největší pravděpodobností následovat po sobě. Přístup olomouckých lingvistů je odlišný. Namísto pravděpodobnosti sledují primárně unikátní jazykové vzorce jednotlivce, které fungují jako jeho osobní „otisk prstu“ nebo spíš „otisk řeči“.
Díky detailní jazykové analýze jsou schopni identifikovat málo používaná slova typická pro konkrétního autora a na základě toho napodobit jeho styl. Jedná se o tzv. hapaxovou metodu, která je založena na identifikaci těchto tzv. hapaxů, jazykového jevu, kdy se pravidelně opakují slova v textu daného jedince, která mají sice malou četnost, ale jsou pro jedince typická, včetně jejich sentimentu. „Naše metoda sleduje určité vlastnosti slov v řeči: to, že se něco objevuje řídce, ale vždy. Například jednou za den zmíníte, že je něčeho „půl“, či že chcete spolupracovat. Cloakspeech identifikuje, že tato slova jsou pro vás typická. K identifikaci jedince ho neoddělujeme od témat, o kterých mluví, protože témata jsou pro jedince typická,“ vysvětluje hapaxovou metodu jeden z autorů, lingvista Dan Faltýnek.
„Na počátku našeho výzkumu nebyl cíl stvořit nástroj Cloakspeech, ale prováděli jsme základní výzkum ve forenzní analýze řeči. Vytvořili jsme postup, který překonal předchozí postupy, neboť nám dal profil člověka v obsahových slovech. Uvědomili jsme si, že lidé jsou typičtí tím, na které pocity a obsahy často myslí a to jim dává jedinečnost, kterou jsme schopni rozpoznat mezi ostatními,“ říká Dan Faltýnek a doplňuje, že v tu chvíli si uvědomili možný komerční potenciál: „Když jsme to objevili, tak jsme si uvědomili, že můžeme vzít specifická slova jedince a donutit umělou inteligenci mluvit jako konkrétní člověk. Cloakspeech jsme stvořili, protože jsme si uvědomili, že může pomáhat třeba v krizových situacích, jako jsou povodně či pandemie, ohroženým skupinám, protože transformuje text do podoby, aby mu konkrétní jedinci lépe rozuměli. Cloakspeech zdůrazní témata dané skupiny, třeba mladých či seniorů, na základě konkrétního jedince.“
Vědci přístup označují jako single-person personalizaci – koncept, který se zásadně liší od současné personalizace obsahu, která jedince zařazuje do širokých sociálních skupin a přizpůsobuje nabízené informace na základě těchto kategorií – například v internetové reklamě nebo na sociálních sítích. Oproti tomu přístup vědců z UP cílí na skutečnou individualizaci, kde lze oslovovat přímo jednotlivce s maximální přesností, nejen v marketingu, ale například i v novém typu sociálních sítí. Výsledkem je sdělení, které je pro daného jedince přirozenější, srozumitelnější a emočně silnější.
Umělá inteligence se rozvinula díky lingvistům
Nástroj je dle vědců nezávislý na jazyku, jeho použití ověřovali například na angličtině či čínštině, neboť druhým spoluautorem je Ondřej Kučera z Katedry asijských studií, který kromě obecné lingvistiky vystudoval i čínskou filologii.
Při představení nástroje se na vědce snesla i vlna kritických otázek, zda nástroj nemůže být třeba právě v Číně zneužit. Výzkumníci kritiku odráželi s tím, že vývoj není možné zastavit a pokud by s tímto nástrojem nepřišli oni, přišel by s ním někdo jiný. Nad etickými aspekty se však zamýšlejí a nechtějí nástroj prodávat do rukou, kde by mohl být zneužit, nechtějí ho tedy prodávat Rusům, ani Číňanům, ale dokonce prý ani Američanům.
Petr Suchomel, vedoucí Oddělení transferu technologií olomoucké univerzity, k tomu říká: „Můžeme samozřejmě dělat jen vědu a žít za svými hradbami, ale to nikdo nechceme. Jsem strašně rád, že tato inovace vznikla právě na Filozofické fakultě. Máme tu lingvistiku použitelnou v praxi a lidé nás vědce platí, abychom společnost posouvali dál. Že musíme být u toho velmi opatrní, toho jsme si vědomi."
O nástroj již projevily zájem bezpečnostní složky, které by ho mohly využívat ke ztotožňování osob na internetu, třeba anonymních uživatelů v diskuzích. Nástroj však může provést analýzu po načtení několika textů, nikoliv dle jednoho komentáře. Dan Faltýnek v tom nevidí problém: „Ti, kdo pravidelně přispívají do diskuzí, často vyprodukují stovky stran textů. Digitální stopa lidí na internetu je dnes velká.“ Vědci mají na základě délky textu také zpracovanou statistiku pravděpodobnosti, že text psala totožná osoba, přesnost je podle nich vysoká.
Nástroj zatím nedokáže diskuzi sám prohledat, texty se do něj musí nakopírovat, ale vše je podle výzkumníků otázkou peněz, takže pokud bude o nástroj zájem, funkce do něj mohou být doprogramovány. O softwarové řešení se stará mladý olomoucký startup Relspeek. Jeho zakladatel Pavel Procházka, který je taktéž absolventem olomoucké univerzity, říká, že jde o jednu z jejich prvních zakázek a svou budoucnost tak trochu spojili s jeho úspěchem, ve který věří. Vývoj byl velmi rychlý, řešení naprogramovali za tři měsíce. „Lingvisté na Filozofické fakultě nám dali velmi dobré zadání,“ říká Procházka.
Ondřej Kučera doufá, že nástroj může být pro Filozofickou fakultu Univerzity Palackého v Olomouci přínosný ve dvou věcech: „Jednak bychom z toho mohli získat nějaký příjem, libovolně malý či velký, to je v těchto technologiích často těžko předvídatelné. Mohl by nám ale také zvýšit prestiž. Už nás unavuje pořád odrážet otázky na to, jestli se Filozofická fakulta věnuje vědecké činnosti, jestli to nejsou jen pohádky a povídky, čímž na nás většinou útočí kolegové z přírodních věd. Je třeba si uvědomit, že nejen tato technologie, ale celá umělá inteligence je postavena na jazykových modelech a je to výsledkem práce lingvistů, ne matematiků,“ zdůrazňuje Ondřej Kučera.
- Autor článku: ano
- Zdroj: VědaVýzkum.cz