Přední evropské firmy, výzkumné instituce a velká výpočetní centra zabývající se umělou inteligencí spojují své síly a odborné znalosti, aby v projektu OpenEuroLLM vyvinuly otevřené velké jazykové modely nové generace podporující rozvoj evropských schopností v oblasti umělé inteligence. Univerzita Karlova je hlavním koordinátorem projektu.
Konsorcium 20 předních evropských výzkumných institucí, firem a center EuroHPC, které koordinuje Jan Hajič z Univerzity Karlovy a spoluvede Peter Sarlin (AMD Silo AI, Finsko), vybuduje rodinu výkonných, vícejazyčných velkých jazykových modelů (LLM) pro komerční, průmyslové a veřejné služby. „Transparentní modely s otevřeným zdrojovým kódem, vyhovující i evropské regulaci, demokratizují přístup k vysoce kvalitním technologiím v oboru umělé inteligence a posílí schopnost evropských firem konkurovat na globálním trhu a veřejným organizacím umožní poskytovat účinné veřejné služby,“ vysvětlil koordinátor projektu Jan Hajič z Matematicko-fyzikální fakulty UK.
Projekt OpenEuroLLM je v souladu s potřebou zlepšit konkurenceschopnost a digitální suverenitu Evropy. „Projekt je ukázkovým příkladem spolupráce různých sektorů pro vývoj evropských produktů umělé inteligence respektujících hodnoty uznávané v celém evropském technologickém ekosystému. Modely budou respektovat evropský regulační rámec, který zajišťuje soulad s evropskými hodnotami a zároveň umožňuje zachovat technologickou excelenci,“ podtrhla rektorka Univerzity Karlovy Milena Králíčková.
Ve spolupráci s komunitami podporujícími otevřenou vědu, jako je LAION, open-sci a OpenML, a dalšími odborníky v oboru umělé inteligence sdruženými v rámci poradního výboru projektu (OpenEuroLLM Open Strategic Partnership Board) zajistí, že modely, software, data a evaluační postupy budou plně otevřené a budou moci být doladěny pro specifické potřeby výzkumu, průmyslu i veřejného sektoru. Tyto výkonné vícejazyčné modely zachovají jazykovou i kulturní rozmanitost a v éře umělé inteligence umožní evropským společnostem vyvíjet vysoce kvalitní produkty a služby.
Projekt, kterému byla udělena pečeť STEP (Strategic Technologies for Europe Platform), využívá výsledků předchozích evropských projektů a zkušeností partnerů, včetně rozsáhlých vysoce kvalitních dat a dříve vyvinutých pilotních velkých jazykových modelů. Konsorcium zahájí svou činnost 1. února 2025 a bude financováno Evropskou komisí v rámci programu Digitální Evropa.
Projekt zapadá do bohaté české národní scény s řadou center, univerzit a startupů, zabývajících se výzkumem v oblasti umělé inteligence a zpracování přirozeného jazyka. Univerzita Karlova podporuje otevřenou vědu řadou projektů a aktivit, včetně účasti v národním ekosystému EOSC CZ, v několika evropských výzkumných infrastrukturách a také spoluprací s univerzitami a výzkumnými centry v Evropě i mimo ni. V rámci evropských programů podporovaných přímo Evropskou komisí je OpenEuroLLM projekt s dosud největším celkovým objemem financování koordinovaný z ČR (celkem 34 mil. eur plus kapacity EuroHPC poskytnuté bezplatně). Povinné kofinancování zajišťuje MŠMT ČR.
Zdroj: Univerzita Karlova
Ústav formální a aplikované lingvistiky, sekce informatiky Matematicko-fyzikální fakulty Univerzity Karlovy (ÚFAL MFF UK) se sídlem v Praze, je výzkumný ústav s více než třicetiletou tradicí a plným magisterským a doktorandským programem v oblasti počítačové lingvistiky a zpracování přirozeného jazyka. Podílel se nebo koordinoval mnoho projektů financovaných Evropskou komisí nebo agenturami v USA, a vedl i velké národní projekty. V rámci Ústavu je provozován i národní technický uzel evropských výzkumných infrastruktur CLARIN, DARIAH a EHRI. Jeho přibližně 100 zaměstnanců (včetně asi 30 doktorandů) kombinuje výzkumnou a pedagogickou expertízu v mnoha oblastech informatiky, hlubokého učení, výpočetní lingvistiky, teoretické lingvistiky, umělé inteligence a zpracování přirozeného jazyka.
- Autor článku: ne
- Zdroj: Univerzita Karlova