Mnoho desetiletí lidé snili o tom, že jim budou s domácími pracemi pomáhat speciálně vyškolení roboti. Jednou z největších překážek je ale přimět stroje, aby našim pokynům rozuměly. Lidský jazyk je totiž často nejednoznačný.
Jakým způsobem se o věcech bavíme, je vysoce závislé na kontextu a obvykle to vyžaduje vrozené porozumění pro fungování okolního světa. Právě tato vlastnost je klíčová pro to, abychom rozluštili, o čem mluvíme. Jinými slovy, zatímco lze roboty vycvičit, aby plnili námi zadané úkoly, sdělit jim naše záměry je výrazně složitější.
Pokud vůbec mají nějakou schopnost rozumět jazyku, jsou roboti obvykle navrženi pouze pro splnění krátkých a velmi specifických pokynů. Rozhodně tedy nedokážou zpracovat příkazy jako „Potřebuji něco na umytí nádobí“ a stejně komplikované jsou pro ně i vícekrokové požadavky typu „Můžeš dát to jablko zpátky do lednice a přinést čokoládu?“
Umělá inteligence napíše i prózu
Dobrou zprávou je, že vědci nyní už intenzivně pracují na tom, aby se schopnosti robotů zlepšily. Třeba společnost OpenAI se aktuálně zabývá vývojem jazykového modelu GPT-3, který je schopný přelomových lingvistických výkonů. Díky učení na obrovském množství textu získaném na internetu dokáže umělá inteligence vygenerovat třeba vysoce kvalitní prózu. A to zdaleka není vše. Zvládne též provozování přesvědčivých chobotů či odpovídání na komplikované otázky týkající se zadaných textů.
Na vlastní umělé inteligenci ale pracují i vývojáři společnosti Google. Ti se ve svém nejnovějším projektu snaží hlavně zlepšit porozumění lidským pokynům. Zkombinováním jejich jazykového modelu PaLM se stroji vyrobenými firmou Everyday Robots vytvořili prototyp mechanizovaných komorníků, kteří mohou po celém domě provádět úkoly na základě hlasových příkazů. Roboti pohybující se na kolečkách mají jediné robotické rameno a hlavu nabitou senzory, což jim ke splnění různých základních činností bohatě stačí.
Inženýři roboty nejprve dálkově ovládali, poté se však rozhodli vytvořit zcela nový řídicí software, který využívá jazykové dovednosti zmíněného PaLMu. Díky němu je možné převést mluvené nebo psané příkazy od člověka do akcí potřebných k jejich dosažení. Software využívá takzvaný řetězec myšlenkových podnětů, který umožňuje robotům rozdělit problémy do řady mezikroků. Například příkaz „Dej mi kolu“ lze převést na „Jdi do kuchyně, otevři ledničku, seber kolu a vrať se do obývacího pokoje“.
První výsledky jsou slibné
Při testování dostali roboti od vývojářů 101 instrukcí, v 84 procentech případů na ně zvládli rozumně zareagovat a v 74 procentech je také bez problémů vykonali. „To představuje čtrnácti- a třináctiprocentní zlepšení ve srovnání s roboty používajícími méně výkonné jazykové modely,“ napsal na svém blogu, který citoval web Singularity Hub, šéf robotiky společnosti Google Vincent Vanhoucke. Zároveň dodal, že roboti používající systém PaLM také zaznamenali o 26 procent lepší schopnost provádět složité vícekrokové požadavky.
Celý systém je zatím ve fázi vývoje a roboti stále mohou být rozhozeni i tak jednoduchými věcmi, jako je změna osvětlení nebo přesun objektů ze známých pozic. Někteří vědci navíc polemizují, zda jsou potíže s porozuměním jazyka skutečně naléhavější než snaha naučit roboty provádět nové úkoly v neustále se měnícím světě. I tak se dá ale očekávat, že jazykové dovednosti umělé inteligence se budou v příštích letech výrazně zdokonalovat, což nadále zvýší její využívání v běžném životě.