Nebyl to ten druh rozhovoru, který by vám byl příjemný. Jednak jsem musel mluvit příliš hlasitě a jednak můj partner neposlouchal. Nevím, jestli se právě staral o to, aby do válců dávkoval dostatečné množství benzinu, ale moje výzvy k přehrání následující skladby na kompaktním disku s ledovým klidem ignoroval. Jeho věta „hlasový příkaz nerozeznán“ ve mně po desátém opakování začala vzbuzovat nutkavou touhu provést mu něco skutečně ošklivého. Zaujalo jej, až když jsem požádal o skladbu předchozí. No tak jo, milý Peugeote 407.
Učit se stále rychleji
Peugeot není mezi současnými automobily svou minimální schopností pohovořit s člověkem výjimečný. Od monologů z osmdesátých let typu „Vždyť ještě není taková zima, tak k sakru nastartuj!“ je sice pokrok při hovoru s vozy znatelný, ale k uspokojení je stále daleko. Koncem devadesátých let se do sériových automobilů poprvé dostalo hlasové ovládání, vozy uměly rozeznat na padesát příkazů. Dnes jich zvládají kolem dvou set, přičemž si pamatují navíc dalších čtyři sta slov. Kromě angličtiny pro ně není problém reagovat na výrazy v němčině, francouzštině, italštině nebo španělštině. Jazyky ale nejsou všechno.
Každý, kdo někdy zkusil využít hlasové ovládání v nějakém současném voze, to nejspíš udělal jen jednou. A to z pouhé zvědavosti. Komunikace spočívající v zadávání jednoduchých příkazů v přesné posloupnosti s pečlivě odměřenými mezerami není ničím, co by člověk měl chuť opakovat. Zvláště s přihlédnutím k tomu, jak je systém schopen je plnit. To však neznamená, že byste si za pár let se svým automobilem nemohli popovídat skutečně na úrovni.
Více je někdy více
K čemu ale bude hlasové ovládání dobré? Pro odpověď je třeba si připomenout celkový vývojový kontext. Elektronika a software se na celkových vylepšeních automobilů podílejí devadesáti procenty. A luxusní automobily se přibližují spíše slušně vybavené technologické firmě. Průměrně se v nich dá nalézt šedesát až sedmdesát počítačů, přičemž na celkových nákladech na výrobu vozu se elektronika a software podílejí od třiceti do čtyřiceti procent.
Pokud by řidič měl byť jen ke třetině z nich mít ovladače v okolí volantu, patrně by se nikdy nerozjel. Zatímco v osmdesátých letech se zvláštní počítač staral o klimatizaci a jiný zajišťoval chod autorádia, v dnešních automobilech se počítače čím dál častěji sdružují. Výsledkem jsou dvanáctipalcové displeje futuristicky vyjíždějící z přístrojové desky. Mezi ovládáním klimatizace, zahřívání sedadel, osvětlení vozu, přehrávače kompaktních disků či nastavení tlumičů se potom řidič pohybuje pomocí jediného otočného joysticku. Podobný přístup se objevuje u všech luxusních vozů, přičemž za příklad může posloužit rozhraní MMI u Audi.
Do jisté míry má sdružené ovládání svůj půvab, ale ona hranice je velmi tenká. Poznali to třeba v BMW těsně po uvedení současné generace sedmé řady, v níž poprvé představili obdobný systém iDrive. Pro majitele těchto vozů byl příliš komplikovaný, ovládání velmi zdlouhavé a stížnosti se jen hrnuly. Modely, které přišly po sedmičce, proto dostaly iDrive ve zjednodušené podobě.
Hlasové ovládání přitom může orientaci v těchto systémech značně zjednodušit. Pro řidiče patří mezi nejnáročnější činnosti, pokud mají za jízdy zadávat data do navigačního systému, vyhledávat čísla v telefonním seznamu, ladit radiostanici či nastavovat klimatizaci. Všechny automobilky, které nabízejí hlasové ovládání jako nadstandardní výbavu, se proto právě na tyto funkce soustředí nejvíce.
Možnosti využití lidského hlasu sahají mnohem dál. U Audi A8 řidič při startování motoru mačká na plošku, jež je zároveň skenerem jeho otisků prstu. Počítač je schopen k danému otisku přiřadit všechna nastavení vozu včetně polohy sedadel a volantu, oblíbené radiostanice či teploty vytápění. Není důvodem, proč by podobně nemohl jiný systém fungovat i na základě pouhého rozpoznání hlasu. V paměti počítače místo rozhodně je.
Každé čtyři roky se podle Moorova zákona desetinásobně zvýší kapacita paměti, jíž disponují počítače uvnitř automobilů. Zatímco v osmdesátých letech stačilo deset kilobytů, v současnosti se operační paměť ve vozech počítá na gigabyty. U BMW má třeba pouze systém rozpoznávání hlasu Car Communication Computer paměť o velikosti 64 megabytů.
Co je sci-fi a co není
Jak ovšem proměnit schematický pajazyk, s jehož pomocí nyní hovoříme s automobily, v přirozenou řeč? Bezpochyby postupně. Vedoucí projektu pro komunikaci člověka s vozem Jochen Eckert z FIW (Forschungs und Innovationszentrum) mnichovské automobilky BMW uvádí, že nejblíže uvedení na trh jsou systémy převádějící psaný text do mluvy a obráceně. První lze využít při vyhledávání stanice na autorádiu či jména osoby, které chce řidič telefonovat. Systém v automobilu přečte zvolený seznam a řidič z něj vybere, co požaduje, aniž by spustil oči ze silnice. Bude-li počítač automobilu zvládat rovněž převádění mluvy do psané formy, může řidič pohodlně nadiktovat e-mail nebo SMS a vzápětí je hlasovým příkazem odeslat. Tím se však od pajazyka příliš nevzdálí.
Dalším krokem k přirozenosti je zvyknout automobily na to, že jim někdo skáče do řeči. Vyjmenovávání sáhodlouhých seznamů po čase začne být pro řidiče otravné, protože tím ztrácí zbytečně čas. Nové systémy v posledním vývojovém stadiu už umožňují počítač kdykoli přerušit a vybrat si z dosavadní nabídky. Zdaleka nejtěžší však bude automobily naučit myslet alespoň částečně po lidsku a využívat při tom kontextu. Hrůza komunikace se současnými vozy totiž spočívá v tom, že právě kontext jejich systémy berou v potaz minimálně. „Ideální by bylo, pokud by počítač dokázal dešifrovat řidičovu poznámku ,Je mi zima na nohy‘ a rozpoznal, že má zvýšit teplotu v dolní části vozu,“ tvrdí Jochen Eckert. „To je však zatím spíše ve sféře sci-fi.“
Nic se nepředvádí hůře než flexibilita systému, který je v počátečním stadiu vývoje. Při návštěvě FIW vypadala demonstrace možností interakce vozu s člověkem jako naučený rozhovor s mluvícím papouškem. Přesto byl na hony vzdálen bezmocnému opakování téže věty:
(před příjezdem k mnichovskému letišti)
- Chtěl bych vědět, zda letadlo ze Stuttgartu nemá zpoždění.
- V kolik hodin je předpokládaný přílet letadla?
- V deset.
- Znáte číslo letu?
- Ne.
- V 9.45 přistává letadlo společnosti Lufthansa, v 10.15 přistává letadlo společnosti easyJet. Který z nich vás zajímá?
- Lufthansa.
- Let společnosti Lufthansa přistane podle letového řádu v 9.45. Máte nějaké další dotazy?
- Kde mohu zaparkovat?
- Na parkovišti D je 115 volných míst. Máte nějaké další dotazy?
- Ne, děkuji.
Díky propojení s internetem je systém schopen zjistit všechny požadované informace. O jeho uvedení do výroby však zatím v BMW konkrétně nehovoří, protože na to zdaleka není připraven. Odborníci v automobilovém průmyslu přesto soudí, že by v horizontu pěti až deseti let mohl člověk ze svého vozu komunikovat s přístroji ve vlastním domě. A proti tomu je rozhovor o příletech na mnichovské letiště hračka.
Těkavé pohyby
Porozumět lidské řeči by počítačům v automobilech měly pomáhat také systémy sledující gesta řidiče. Zkoušejí se proto kamery zaznamenávající pohyby hlavou coby znamení souhlasu nebo nesouhlasu či podobně motivovaná gesta rukou. Snaží se naučit počítače rozpoznávat náladu řidiče podle intonace a stupně podrážděnosti v hlase. Tou nejmenší překážkou jsou přitom náklady, které by na zabudování podobných systémů do automobilů musely být vynaloženy. Mikrofony ve vozech již jsou, neboť je využívají mobilní telefony. Malé kamery sledující pohyby hlavy a rukou mohou být stejně tak součástí zabezpečení automobilu proti krádeži nebo mohou chránit řidiče před ztrátou pozornosti. A také mnoho nestojí. Jedinou překážkou je vymyslet dostatečně chytrý software.
Veškerá snaha o zdokonalení komunikace mezi člověkem a automobilem vypadá na první pohled jako monstrózní cirkus, naprosto zbytečný. K čemu hlasové ovládání, když přece zmáčknutí těch pár tlačítek nebo pohnutí páčkou nepředstavuje pro řidiče zvláštní zátěž? Proč se snažit domluvit se svým automobilem, když jsme se bez toho dosud obešli? Chytré vynálezy trpí jedním zcela nenápadným, ale nezanedbatelným kouzlem. Jakmile začnou bezproblémově fungovat, těžko si představit, že to dříve šlo také bez nich. Aneb jak prohlásil v roce 1977 v méně jasnozřivé chvilce výkonný ředitel společnosti Digital Equipment Ken Olson: „Neexistuje žádný důvod, proč by lidé měli mít v budoucnu doma svůj osobní počítač.“