„Talk to me, Goose,“ říká v původním Top Gunu z roku 1986 Maverick v podání Toma Cruise svému parťákovi a operátorovi zbraňových systémů ve snaze zjistit, kde se zrovna nacházejí nepřátelské letouny. Postava Goose v ,jedničce‘ zahyne, místo něj se však v dalším pokračování může egoistický pilot spolehnout na svého dalšího známého z dřívějška, a sice na Icemana. Ostatně i proto by pro zbrusu nový blockbuster, který stihl za pouhých šest dní od premiéry celosvětově vydělat už přes 300 milionů dolarů (zhruba 6,9 miliardy korun), spíše seděla hláška: „Talk to me, Ice“. Jenže právě to je naneštěstí vzhledem k hercovu zdravotnímu stavu poněkud komplikované.
Představitel Icemana alias admirála Toma Kazanského Val Kilmer prodělal před lety rakovinu hrtanu, která jej doslova připravila o hlas. Dvaašedesátiletý Kilmer chtěl však být součástí Maverickova druhého filmového dobrodružství stůj co stůj, a proto hledal způsob, jak své postavě, a vlastně i sám sobě, hlas navrátit. A zásluhou umělé inteligence a londýnské společnosti Sonantic se to nakonec skutečně podařilo.
„Od samého začátku bylo naším cílem vytvořit hlasový model, na který by Val mohl být pyšný,“ nechal se podle webu časopisu Fortune již před časem slyšet spoluzakladatel Sonanticu John Flynn. „Strašně moc jsme mu chtěli jeho hlas vrátit a nabídnout tak k dispozici zcela nový nástroj, který by se v budoucnu hodil pro jakékoliv kreativní projekty.“
Speciální případ
Při tvorbě konkrétního hlasového modelu postupují v Sonanticu obvykle tak, že dají hercům do rukou papír se specifickým textem a nechají ho jej přečíst. V Kilmerově případě ale bylo zapotřebí jít na celou věc kvůli nespolupracujícím hlasivkám úplně jinak. Pracovníci britské firmy museli použít staré záznamy hercova hlasu a následně přizvat na pomoc umělou inteligenci.
Problémem nicméně bylo, že ani té se zpočátku kýženého cíle dosáhnout nedařilo. Měla totiž k dispozici desetkrát méně dat, než kolik by jich ideálně potřebovala, a proto bylo nutné vymyslet zcela nový algoritmus, jenž by tyto neduhy odstranil.
„Nakonec jsme vygenerovali více než 40 odlišných hlasových modelů a vybrali ten nejlepší, nejkvalitnější a nejvýstižnější,“ prozradil Flynn. „Nové algoritmy jsou dnes zakomponovány do našeho hlasového generátoru, takže z nich budou automaticky těžit i budoucí klienti.“
Do jaké míry se lidem ze společnosti Sonantic (a její umělé inteligenci) podařilo Kilmerův hlas replikovat, je dobře patrné na přiloženém videu. Samotná hollywoodská hvězda je s jejich prací každopádně nadmíru spokojena.
„Schopnost komunikovat je hlavním smyslem naší existence. Mí přátelé mi kvůli důsledkům rakoviny hrtanu často rozuměli jen stěží. Mít tak šanci povědět jim svůj příběh hlasem, který zní autenticky a je mi povědomý, je pro mě neskutečným darem,“ řekl Kilmer.
Potenciální hrozba
Jak konkrétně Sonantic jednotlivé hlasové modely vytváří, vedení firmy úzkostlivě tají. Ví se však, že k tomu využívá patentovaný software, který je založen na principech hlubokého učení. Tato metoda dle zmíněného webu v minulosti vedla k mnoha průlomům na poli umělé inteligence.
Přestože původní záměry inženýrů zabývajících se vývojem této technologie jsou veskrze ušlechtilé, je potřeba hledět na její rozmach s opatrností, neboť se dá současně i velmi snadno zneužít. O tom, jak neblahé důsledky to může mít, se předloni na vlastní kůži přesvědčili pracovníci nejmenované hongkongské banky. Naletěli totiž podvodníkovi vydávajícímu se v telefonu pomocí speciálně upraveného hlasu za jejich šéfa, kterému nechtěně, leč dobrovolně vydali celých 35 milionů dolarů.
„K manipulaci zvukových záznamů, která je mnohem snadněji proveditelná než vytváření deep fake videí, bude docházet čím dál častěji, přičemž bez dodatečného vzdělávání a upozorňování na tento nový druh podvodů bude, spolu s čím dál autentičtějšími metodami, obětí ze strany firem pravděpodobně přibývat,“ ocitoval americký Forbes bývalého policejního důstojníka a odborníka na kyberbezpečnost u společnosti ESET Jakea Moora.