Z IT oblasti měli mnohaleté zkušenosti, spíš než běžné věci však chtěli dělat ty, o kterých se mluví a píše. Jako nejvíce perspektivní kolegové Martin Franc a Mario Mitas nakonec vyhodnotili oblast umělé inteligence a specificky virtuálních asistentů. „Viděli jsme v nich nový způsob uživatelského rozhraní, které je extrémně přirozené, ale z technického pohledu stále netradiční,“ přibližuje Franc. V roce 2017 tak duo založilo společnost Agnostix, která kromě běžných IT služeb poskytuje systémy pro virtuální asistenty v segmentu bankovnictví, logistiky i e-commerce.
O tom, že je taková technologie užitečným pomocníkem, tehdy ani jeden z nich nepochyboval. Dokazovaly to koneckonců i velké technologické společnosti, jakými jsou například Google či Apple a jejich v zahraničí hojně využívané systémy Google Assistant a Siri. Jenže ty stále nepodporují český jazyk. Pracují navíc pouze na principu povelu a úkolu.
Konkurovat těmto gigantům ani jeden ze zakladatelů nechtěl. Místo toho využili již existujících komponent a zaměřili se na to, aby robota ,naučili‘ vést s člověkem dialog. „Neřešíme, jestli systém správně rozumí, nebo jestli rozpozná, co člověk říká, to už je totiž většinou zvládnuté, zajímá nás podstata toho povídání,“ vysvětluje Franc s tím, že se jedná o kombinaci zpracování přirozeného jazyka, strojového učení a teorie komunikace.
Virtuálního asistenta si lze rovněž představit jako soustavu technických komponent využívajících již existující technologie. Ty jsou dnes tak daleko, že nový systém není třeba učit konkrétní jazyk, protože už existují složky, které ho umí.
Pro lepší představu přirovnává Mitas ,základ‘, z něhož se virtuální asistent formuje, k pětiletému dítěti: „Zná v podstatě všechna slova toho jazyka a funguje tak, že když mu nějaké povíte, tak přikývne a řekne vám: ,Ano, tomu slovu rozumím.‘ My to dítě pak učíme divadelní hru. A tak to skutečně probíhá. Máme scénáristy, kteří píšou, jak ten dialog má vypadat, aby působil přirozeně a reálně.“
Jak košaté věty budou a kolik alternativ různých odpovědí bude robot schopen použít, pak záleží na tom, jak obsáhlý scénář mu bude poskytnut. Člověk, který ho píše, se tak snaží pokrýt všechny možné alternativy, které v rozhovoru mohou nastat. Systém navíc musí být schopný reagovat i na situace, jež nadesignované nejsou. „To znamená, že když člověk někam uskočí, tak je robot schopný to zaregistrovat, změnit téma a provést ho novým dialogem. Na konci vyhodnotí, jestli je správný čas vrátit se k původnímu tématu, nebo ho může zapomenout. Je to podobné, jako když něco vyprávíte, odskočíte a pak řeknete: ,Kde jsme to byli?‘“ přibližuje Franc.
Vyfiltruje, zanalyzuje a porovná
Výsledkem Francova a Mitasova snažení je například virtuální pomocník mobilního bankovnictví, který je uživateli schopný odpovědět na dotazy týkající se jeho útrat. Čímž dotyčnému ušetří značné množství času. Protože pokud se chce dnes člověk zorientovat ve svých útratách, musí se nejprve přihlásit do internetového bankovnictví, anebo zvolit jednodušší cestu a otevřít si přehled v mobilní aplikaci. Ale jediné, co pak dostane, je jakási tabulka všech příjmů a výdajů. V té se následně musí sám zorientovat, zanalyzovat ji a případně vyfiltrovat.
„Banka s virtuálním asistentem vám tuhle službu poskytne předchroupanou. Zeptáte se ho: ,Kolik jsem utratil minulý měsíc ve Starbucks?‘ Asistent pak řekne přesnou částku a zároveň dodá: ,Hele, je to víc než minulý měsíc a o 30 procent víc než lidé v tvém věku,‘“ konstatuje Franc a dodává, že tuto technologii využívá například ČSOB, která nabízí služby virtuální asistentky Kate. Známá je pak také Aneta z Air Bank.
Bankovní sektor samozřejmě není jediný, kde se dá technologie, jejíž vývoj stojí miliony korun, využít. Užitečná může být rovněž v logistice. Typicky u kurýrů, kteří během řízení obsluhují telefon a vyřizují jednotlivé objednávky. Hlasoví asistenti v autech dnes koneckonců představují asi nejrozšířenější implementaci. Důkazem je tomu například společnost Škoda a její virtuální asistentka Laura nebo Volvo, jež integruje asistenta od Googlu.
Své uplatnění pak systémy nachází také v call centrech, kde mohou částečně nahrazovat lidskou sílu tím, že budou představovat jakýsi filtr. Ten rozhodne, které požadavky volajících zvládne technologie vyřešit sama a které z nich by měl zpracovat lidský operátor.
„Velké desítky procent dotazů jsou triviální úkoly, které by člověk zvládl sám, kdyby se někam podíval nebo se zamyslel. Virtuální asistent dokáže hovor přijmout, představit se, zeptat se klienta, s čím má problém, a zanalyzovat, jestli to zvládne vyřešit, nebo by to měl předat pokročilejší obsluze,“ říká Franc. Na to konto doplňuje, že uvedená technologie má potenciál například u nočních směn, kdy sice volá méně lidí, ale v některých oblastech je vzhledem k nečekaným událostem třeba tento čas pokrýt. Oproti lidské síle je robot navíc méně nákladný. Podle jeho názoru představuje ,pouze‘ 10 až 15 procent nákladů člověka.
Ne všude se ale pomoc asistentů hodí. V nějakých případech bude vždy nutné spoléhat pouze na lidský faktor. Takovým segmentem je třeba linka první pomoci. Na druhou stranu se však roboti značně osvědčili i během pandemie, kdy pomáhali jako pracovní síla na call centrech a na základě informací ze strany volajícího určovali, zda je přepojí na operátora, anebo s nimi problém vyřeší sami.
Od programátorů až po specialisty na český jazyk
Aby robot simuloval konverzaci co možná nejpřesvědčivěji, podílí se na jeho ,výcviku‘ řada odborníků z různých oborů. Těch je v případě firmy Agnostix momentálně kolem deseti. Kromě IT programátorů hrají důležitou roli rovněž lingvisté, kteří rozumí tomu, jak český jazyk funguje. Algoritmy upravují tak, aby systém správně skloňoval a přechyloval. Copywriteři pak text dělají přirozený a čtivý.
„Čeština je v tomto ohledu neštěstí. Chce to hodně úsilí, aby vám asistent rozuměl, když jednu větu dokážete říct čtyřmi různými způsoby,“ tvrdí Franc. „A pak se vám stane, že investujete roky úsilí do toho, abyste nasadili krásného dokonalého hlasového asistenta, který zvládá perfektně češtinu, a zjistíte, že lidé spisovně vlastně vůbec nemluví,“ přidává se Mitas s tím, že opravdové učení začíná až v momentě, kdy systém nasazují na produkci a je třeba zpětně zjišťovat, v jakých situacích docházelo k nedorozuměním.
Problém často představuje slang nebo špatně zvolené slovo, kdy člověk například zamění odpovědnost za zodpovědnost. Neplechu může napáchat i košatější konverzace, která je přirozená hlavně pro většinu starších lidí. „Vyhodnotit podstatu nějaké potřeby z odstavce je pro stroje složité. Asistenti fungují nejlépe na jednoduchých větách. Ideálně tedy žádná složitá souvětí, co nejméně výplňových slov a zdvořilostních frází typu ,Dobrý den, prosím vás, byla byste tak laskavá a našla…‘,“ míní Franc a zdůrazňuje, že v případě příliš dlouhých vět pak systém přestává poslouchat.
Podobné situace oba zakladatelé připodobňují k cizincům učícím se jiný jazyk. Dokud mají pouze omezenou slovní zásobu a dorozumívají se v jednoduchých větách, dokáží skousnout malé nedorozumění, protože jim nedojde, že se pletou. Čím víc se ale začnou zdokonalovat, dojdou do fáze, kdy se jejich výkon zhorší, protože začnou být zmatení a nejistí, jestli tomu vlastně rozumí správně. Tohle zhoršení pak trvá do doby, dokud opět nenaberou jistotu.
Se systémy je to stejné: „Na začátku performují strašně dobře, ale nic moc neumí. Jakmile na ně začnou mluvit lidé, musíte je dotrénovávat. A výkon vám jde dolů, protože se objeví strašně moc věcí, které systém rozhodí. Začnete ho spravovat, a až pak se dostanete na špičku.“
Franc je přesvědčený, že za pár let budou roboti rozumět výrazně lépe než nyní, na druhou stranu to však znesnadní vyhodnocovací aparát. „To, že jsou schopni porozumět, je jedna věc, ale být schopní konverzaci strukturovaně zvládnout, když budou mít desítky směrů, kam se rozhovor může stáčet?“ ptá se řečnicky a prozrazuje, že v plánu rovněž je, aby roboti dokázali nedorozumění sami identifikovat a vyhodnotit, proč k nim vlastně došlo.
Největší zájem je o ženské charaktery
Virtuální asistent by dle France měl mít něco, co člověka přiměje s ním dialog vést. Z toho důvodu má každý asistent svoji vlastní osobnost, kterou tým specialistů navrhne ve spolupráci se společností, jež chce služby systému zákazníkům nabízet. Řeší se volba pohlaví, vzdělání, věk i typ zaměstnání. Podle toho se pak odvíjí jak jazyk, tak košatost komunikace. Vliv má samozřejmě i segment, ve kterém je bot využíván.
Slovní zásoba asistenta v bance bude jiná než toho z call centra. „Systém se samozřejmě dokáže přizpůsobovat. Pokud na něj někdo mluví stroze, bude odpovídat stejným způsobem,“ objasňuje Franc s tím, že obecně jsou nejoblíbenější hlasové asistentky ženského pohlaví.
Kolik peněz za systém jednotlivé firmy dají, je relativní. Záleží totiž, jak komplexního virtuálního asistenta očekávají. Platí přitom jednoduchá rovnice – čím propracovanější, tím dražší: „Takže ve chvíli, kdy máte bankovní instituci, má projekt implementace rozpočet desítek až stovek milionů korun.“ Malé firmy s jednoduchým systémem si oproti tomu vystačí s částkou v řádech statisíců.
Do budoucna zakladatelé plánují, že své virtuální asistenty zpřístupní i menším firmám a že jejich cena bude jen zlomek toho, co představuje v současnosti. „Pracujeme na tom, aby tyto technologie byly tak jednoduše přístupné jako jiné programy, které si třeba na internetu stáhnete, nainstalujete a ony fungují bez potřeby dalších úprav. Důležité je aby lidé bez znalosti vědy a strojového učení dokázali asistenta postavit, pustit a on správně fungoval,“ nastiňuje Franc plány do budoucna. Ty zahrnují i ,chytřejší‘ systémy s přirozenými dialogy, během kterých si budou asistenti sami generovat odpovědi tak, aby perfektně odpovídaly konverzaci.
Měli by být rovněž schopní dělat v konverzaci oslí můstky a validovat vstupy. „Když systém čeká, že mu člověk zadá svůj věk, a on místo toho řekne ,úterý odpoledne‘, musí umět říct, proč tomu nerozumí. A to bez toho, aniž by takovou odpověď někdo ručně ve scénáři napsal,“ uzavírá Franc s tím, že v současnosti na uvedený typ systému český trh není ještě zcela připravený. Očekává přitom, že již za několik let budou lidé zcela běžně ovládat hlasem valnou většinu domácích spotřebičů a chytrých zařízení, nikoli jen své mobily.