facebooktwittergoogleinstagram

Věda a výzkum

Portál Vědavýzkum.cz - Nezávislé informace o vědě a výzkumu

IOCB Tech, s.r.o. - hlavní partner portálu Vědavýzkum.cz

Hlavní partner portálu
facebooktwittergoogleinstagram

Ondřej Sotolář: Během mého výzkumu došlo k revoluci v oblasti AI. Uvidíme, kam to povede.

19. 2. 2024
Ondřej Sotolář: Během mého výzkumu došlo k revoluci v oblasti AI. Uvidíme, kam to povede.

Ondřej Sotolář se na Fakultě informatiky Masarykovy univerzity věnuje například vlivu technologií na adolescenty a jejich psychiku. Téma je pro něj osobní, jelikož s manželkou vychovává dva malé syny. Během svého doktorského studia také získal, jako jeden z mála mužů, Pamětní grant Martiny Reoselové, který uděluje Nadační fond IOCB Tech mladým vědcům v oblasti přírodních věd, kteří se snaží skloubit vědu s péčí o děti v předškolním věku. 

sotolar1Získal jste grant Martiny Roeselové pro rodiče vychovávající malé dítě, jak k tomu došlo, že jste byl primárním pečovatelem?

Máme s manželkou dva syny. Starší se narodil v létě 2020 a mladší v létě 2022. Nicméně tomu druhému předcházelo dlouhé rizikové těhotenství mé ženy, takže jsem se od jara 2022 musel stát primárním pečovatelem o staršího syna a částečně o manželku. Porod naštěstí proběhl v pořádku a manželka se dále starala o mladšího syna.

Bylo pro vás jako rodinu klíčové ten grant získat? Co vám umožnil?

Mohli jsme díky němu dát staršího syna do dětské skupiny, kam jsme ho potřebovali umístit ještě před druhými narozeninami. V místě našeho bydliště školka formálně bere i dvouleté děti, ale prakticky tomu tak z kapacitních důvodů není. Dětská skupina vycházela na 9 000 měsíčně, což je částka, která by nám značně zatížila rodinný rozpočet, pokud bychom grant nezískali. V září loňského roku syn nastoupil do státní školky. 

Vaše žena je také ve vědě?

Moje žena je gynekoložka, momentálně vedle rodičovské dovolené chodí jednou týdně pracovat do ambulance. Ze začátku jsem se v tu dobu o mladšího syna staral já, teď máme paní na hlídání. 

V jaké fázi kariéry vás rodičovství zastihlo?

V roce, kdy se narodil starší syn jsem nastoupil na doktorát. Potom, co začal chodit do školky, jsem se zase mohl věnovat vědě, alespoň tedy v běžnou pracovní dobu. Měl jsem po celou dobu velkou oporu ve svém školiteli i své skvělé ženě, za což jsem jim strašně vděčný.

Máte pocit, že rodičovství nějak obohatilo vaši vědeckou práci?

Díky rodičovství se mi přehodnotily priority. Pro nás je rodičovství důležité, nechtěli jsme ho odkládat, tak jsme se rozhodli, že to nějak zvládneme.

Máte v plánu jet na stáž do zahraničí, pojedete s celou rodinou?

Máme v rámci doktorátu výjezd do zahraničí povinný. Letos na jaře se tak chystáme s celou rodinou do Bonnu. Budu tam mít půl úvazek a uvidíme, jak dlouho zůstaneme. Máme tam sice příslib hlídání, ale starší syn už si ve školce zvykl, tak nevíme, jak bude snášet nové prostředí. Po nějaké době by se teoreticky dalo na projektu pracovat vzdáleně, protože varianta pravidelného dojíždění do Bonnu je časově náročná.

sotolar2Pozitivní dopady technologií se málo zkoumají

Jaké je vaše výzkumné téma?

Pět let jsme pracovali na projektu, který se věnoval vlivu moderních technologií na psychiku adolescentů. Byl to velký multioborový projekt. Moje témata tvořila jenom část. Problematice jsme se chtěli věnovat hlavně z kvantitativního hlediska – vyvíjeli jsme nové metodiky, jak psychologické jevy měřit přímo. Klasický výzkum se v kvantitativní psychologii totiž dělá pomocí dotazníků, což je nepřímý způsob měření. Také jsme se snažili zjistit, zda jsou dotazníky jako metoda výzkumu dostatečně vypovídající.

Co si mám představit pod měřením přímo?

Když jsme projekt začínali, rozjeli jsme sběr dat přímo z mobilních zařízení adolescentů. Nechtěli jsme výzkum dělat na nějakých kontrolovaných zařízeních, chtěli jsme využít ta, která účastníci studie vlastní. Ze začátku jsme zjišťovali, co všechno jsme vůbec schopni technicky a eticky sbírat. Smyslem potom bylo sestavovat prediktivní modely na základě objektivních dat a porovnávat naše zjištění s těmi získanými pomocí dotazníků. 

O jaká data se konkrétně jednalo?

Jednalo se jak o data z používání zařízení, tak o obsahová data. Mým hlavním oborem je zpracování přirozeného jazyka. Vycházím ve svém výzkumu z dat z konverzačních aplikací, jako je WhatsApp nebo Messenger. V nich se snažím hledat psychologické jevy, které jsme si definovali v rámci výzkumného projektu. Také jsme pro účely výzkumu vyvinuli Android aplikaci, která byla schopná sbírat objektivní data z telefonů, jako například screenshoty, ale také účastníkům studie předkládala různé dotazníky. Všechno samozřejmě bylo s jejich svolením a anonymizované. 

Kolik jste měli účastníků studie?

Chtěli jsme mít delší, tzv. longitudinální výzkum, takže jsme data sbírali jeden rok. Na začátku jsme cílili na 300 uživatelů, ti ale v průběhu roku postupně odpadali, skončili jsme s počtem někde přes 100 lidí. Nicméně jsme si vyzkoušeli, že jako vědci nejsme schopni provozovat reálnou službu pro zákazníky. Jen vývoj a správa té aplikace pro 300 uživatelů je ohromně náročná. 

Co vás na výzkumu nejvíce překvapilo?

Jak je složité spojovat různé vědecké obory dohromady. Já jsem informatik a publikuji primárně ve vědeckých časopisech zabývajících se informatikou. Většina mých spolupracovníků jsou ale psychologové. Je zajímavé vidět, jak jsou oba obory rozdílné. Přestože například oba používají statistiku, v každém se používá úplně jinak. V informatice vycházíme v našem výzkumu z reálných technických možností. Snažíme se zkoumané věci spíše zjednodušovat. Nicméně pro klinické aplikace v oboru psychologie vycházejí kolegové z nějakých svých potřeb, které nemusí být úplně reálné dnešními metodami uspokojit. Je tak poměrně obtížné dělat multioborový výzkum nejenom z tohoto důvodu, ale také z důvodu následného publikování výsledků, jelikož započítání výsledků z multioborových časopisů není samozřejmé. 

Co vás motivovalo podílet se na multioborové spolupráci s psychology?

Obecně se často studují především negativní dopady používání technologií, typicky online rizika. Nicméně používání technologií nemá jen negativní stránky. A my se tím, že zkoumáme i pozitivní jevy a dopady technologií, snažíme tento pohled nějak vybalancovat. Myslím tím například jevy, které se označují jako SSBC – social support behavior code – sem patří například informační a emocionální podpora, uznání a podobně. 

Co se vám podařilo zjistit?

Nejzajímavější pro mě bylo, že jsme schopni automatizovat dokazování psychologických teorií. Umíme na našich datech natrénovat modely, které jsou potom schopné dané jevy detekovat. Můžeme modelovat distribuci daných jevů v přirozených datech, díky tomu, že jsme měli velice unikátní soubor dat, tedy soukromé konverzace adolescentů. Existuje mnoho výzkumů, které se odehrávají na datech ze sociálních sítí, nicméně my jsme už v našich předchozích publikacích ukázali, že se domény těch dat, co se týče právě výskytu pozitivních jevů, od sebe liší. Data ze sociálních sítí jsou veřejná, zatímco některé jevy se odehrávají spíše v soukromých konverzacích.

Například jsme potvrdili teorii, že zmíněné podpůrné jevy se častěji vyskytují v konverzacích mezi ženami než mezi muži či v konverzacích smíšených. Což se zdá jako banální závěr, nicméně náš přínos je především zmíněná automatizace. Snažíme se naše modely zprovoznit i na masivních souborech dat, které získáte třeba sběrem dat všech uživatelů na Facebooku, což je v podstatě nemožné zkoumat současnými manuálními metodami používanými v sociálních vědách. 

Byla nějaká teorie, kterou se vám naopak potvrdit nepodařilo?

Například nás překvapila absence témat, která se týkají diet a hubnutí, obecně extrémního životního stylu. Zajímavé bylo také zjištění, že jednotlivé kategorie jevů se mezi sebou lingvisticky dost liší. Například jsme měli kategorii, která se jmenovala aggression/harassment, která se dá pomocí klíčových slov identifikovat poměrně dobře. Naopak u návykových látek šlo o celou sémantiku, fráze, větší kusy textů. Ta hantýrka se u jednotlivých jevů dost liší.

Jaká mají vaše zjištění potenciální další využití?

Tím, že se náš obor NLP (natural language processing) rychle vyvíjí, tak výzkum, který je 10 let starý, je z metodologického hlediska zoufale zastaralý. Čili my se primárně snažíme dělat vždy to nejnovější a posouvat hranice možného. Směřujeme k tomu, abychom byli schopni dělat analýzy v reálném čase, což předchozí metody, soustředící se pouze na zpětnou analýzu dat, neumožňovaly. Využití by potom bylo například ve snazším odhalování potenciálně nebezpečného chování mladistvých v online prostoru a následném včasném záchytu psychologických obtíží. 

Studentům ani svým dětem používání technologií a AI nezakazuji

Jakému výzkumnému tématu se věnujete teď?

Na podzim jsme publikovali článek, ve kterém jsme učili velké jazykové modely používat externí nástroje. Jazykové modely, jako je ChatGPT (i když zde se již jedná o komplexní službu, nejen jazykový model), totiž vycházejí z uzavřených dat, na kterých jsou natrénovány. Když se jich zeptáte, jaký je současný kurz mezi korunou a eurem, tak neexistuje žádná technická možnost, jak by vám to mohly říct. Ta uzavřenost je momentálně jeden z velkých limitů a technické možnosti, jak ji překonat, jsou právě ve fázi vývoje. Zároveň se zjistilo, že konečný výsledek zadaného dotazu bývá častěji pravdivý, pokud má model k dispozici nějaké částečné výsledky. Takže jsme zlepšovali přesnost výsledků pro matematické příklady používáním externích nástrojů. Konkrétně jsme výpočty samotné posílali do programovacího jazyka Python, který prováděl exaktní výpočty, které potom vracel tomu modelu. Výsledkem byla úspěšnější generace výsledků. Konečným cílem je naučit modely, jako je ChatGPT, aby se byly samy schopny rozhodnout, kdy je vhodné použít nějaký externí nástroj, následně si jej zavolat, nechat si od něj vrátit správný výsledek a ten dále využít.

Máte radost, že se o AI začala zajímat širší populace?

Pro mě je zajímavé sledovat, jak se ten obor stal široce známým a vstoupilo to do života spoustě lidem. Během trvání našeho výzkumného projektu došlo v podstatě k revoluci v této oblasti, tj. zpracování přirozeného jazyka. Zatímco například před rokem o tom oboru věděli pouze zainteresovaní lidé, loni na podzim po publikování ChatGPT firmou OpenAI si to mohla spousta lidí vyzkoušet. Uvidíme, kam to povede.

Máte obavu z toho, že vysoké školy v oblasti přípravy na širší využívání AI v závěrečných pracích studenty zaspávají?

Já nemůžu mluvit za všechny školy, mám vhled do závěrečných prací na naší fakultě a částečně na Fakultně sociálních věd. Obecně si nemyslím, že by dobré bakalářky vznikaly primárně tím, že se bude k jejich vytvoření používat umělá inteligence. U nás na fakultě je kladen velký důraz na novost prací a často i na programátorskou stránku. Ale pokud studenti použijí AI nástroje pro vylepšení prací, tak si myslím, že to je jedině dobře. Nevidím důvod, proč bych to měl svým studentům zakazovat, když sám při psaní článků využívám všechny možné nástroje, které jsou pro mě užitečné, jako opravy pravopisu nebo reformulace textu. Jsem v podstatě rád, že to studenti používají a naše fakulta v tom určitě nezaspává. Existuje u nás například TeachingLab, kde se kolegové aktivně zabývají tím, jak by učitelé mohli AI nástroje používat, ale také tím, jak by je studenti mohli zneužívat.

Jak se jako rodič stavíte k používání technologií, jako jsou tablety a telefony, malými dětmi?

Asi jako všichni dnešní rodiče si klademe otázku, jak určovat pravidla pro svoje děti, co se týče využívání digitálních technologií. Je to nová věc a odborníkem nejsme nikdo. Doma jsme prošli celou řadou různých pravidel, ale spíše se snažíme pružně reagovat na vzniklé situace. Ze začátku jsme byli velmi opatrní, ale s druhým dítětem jsme zjistili, že z velkého nepřítele se stal užitečný pomocník. 

Plánujete zůstat ve vědě?

Samozřejmě bych chtěl. Náš obor je ale zároveň vhodný pro následné uplatnění v průmyslu, kde se dá také dělat věda a výzkum. Vše bude záviset na příležitostech a na situaci v rodině. V průběhu letošního roku totiž pravděpodobně nastoupím na rodičovskou dovolenou. Chci dát příležitost manželce dodělat si atestaci. Uvidíme, jestli předtím stihnu dodělat doktorát, nebo ne. 

 

Autor: Vědavýzkum.cz (VL)

 


Ondřej Sotolář na Fakultě informatiky Masarykovy univerzity vystudoval bakaláře i magistra a pokračuje zde na doktorátu. Ve svém výzkumu se věnuje zpracování přirozeného jazyka (NLP) a aplikaci AI a strojového učení jako nástrojů pro výzkum. S manželkou bydlí v Jihomoravském kraji. Ve volném čase se věnuje rodině. Rád jezdí na hory a programuje.