Nemesysco, kterou v ČR zastupuje firma Moroz & Partner, vyvinula software na analýzu hlasu
Existuje zábavný detektorek lži, umístěný v brýlích, který analyzuje řeči jejich nositele. Pokud dotyčný lže, na brýlích se mu rozsvítí červené světýlko. Tyto brýle pravdy vyrábí americká firma V Entertainment. Využívá přitom technologie, kterou vyvinul matematik Amir Lieberman z izraelské firmy Nemesysco. Výhradním obchodním zástupcem společnosti Nemesysco pro Českou republiku a Slovensko je konzultační firma Moroz & Partner, proto se týdeník EURO na podrobnosti zeptal Michala Moroze.
EURO: Na jakém principu je tato technologie založena? MOROZ: Podstatou této technologie je algoritmus, který není soustředěn na obsahovou část sdělení, ale umí ze spektra lidského hlasu a z jeho změn v čase separovat typické znaky konkrétních emocí.
EURO: Jak je tato technologie využita? MOROZ: Tato technologie tvoří jádro softwaru, který rozkládá zvuk do mnoha frekvenčních vrstev (Layer Voice Analysis, LVA). Při odpovědích na rutinní otázky se adjustuje na konkrétní hlas a následně analyzuje hlasové frekvence, typické pro projevy určitých typů emocí. Zachycené změny porovnává s projevem těchto emocí u většího vzorku lidí (takzvané emoční šablony). Výsledkem této analýzy není determinující závěr, že dotyčný lže, ale stanovení pravděpodobnosti, s níž zkoumaný mluvčí nehovoří pravdu, protože měl v konkrétní okamžik v hlase určité stopy emocí, které jsou typické pro situaci, kdy člověk klame nebo něco skrývá. Zajímavým případem je třeba problematika gamblingu. Zkoumaná osoba může vykazovat při této otázce zvýšenou úroveň emocí. To nemůže vést samo o sobě k žádnému závěru, ale upozorňuje, na co se má zaměřit následující interview. V něm se pak třeba může odhalit, že dotyčná osoba nemá s gamblingem sama problém, ale její emoce vybudila tato otázka, protože gambling znamenal velký problém pro někoho blízkého.
EURO: Lze tuto technologii s něčím srovnat? MOROZ: Nikoli. Software LVA pracuje zcela odlišně od klasického stresového analyzátoru, a pouze vzdáleně jej lze porovnat s činností polygrafu - detektor lži indikuje změny frekvence srdečního tepu, dechu, změny krevního tlaku a odporu pokožky.
EURO: Starý spor, zda lze, nebo nelze polygraf obelstít, dostane existencí tohoto zařízení asi novou dimenzi. MOROZ: Záznamy polygrafu je zřejmě možné jistým způsobem znehodnotit. Tvrdí se, že bývalí rozvědčíci prošli důkladným výcvikem, protože žádný z nich na Západě nebyl „usvědčen“ na polygrafu. Při vyšetření na polygrafu se střídají otázky běžné a pro vyšetřování relevantní. Na odpovědích na běžné otázky se polygraf adjustuje, aby mohl vykázat rozdíly při odpovědích na ty záludné. Připraví-li se však vyšetřovaný na to, že při odpovědi na banální otázku si vybaví situaci, na níž nerad vzpomíná, pak se mu může podařit polygraf zahltit tak nekompatibilními daty, že je velmi těžké záznamy správně analyzovat. To se v případě LVA téměř nemůže stát, protože pracuje s podvědomými emočními znaky, které jsou v řeči každého člověka.
EURO: A co třeba profesionální herci? Imitátoři? Zpěváci? Prostě ti, kteří se živí hlasem? U nich lze předpokládat, že jej dovedou ovládnout v mnohem větší míře než ostatní? MOROZ: Jejich profesionální dovednosti jsou soustředěny především do slyšitelných hlasových spekter. Hlas ale vykazuje mnohem více těžko kontrolovatelných znaků a analýza pracuje i s frekvenčními přesahy meze slyšitelnosti.
EURO: Do jaké míry záleží na typu mluveného jazyka, respektive na kulturně-sociálním backgroundu mluvčího? MOROZ: Skutečně existují jakési kulturně-jazykové okruhy, které z hlediska funkčnosti tohoto softwaru vykazují uvnitř větší podobnost, navenek pak mezi sebou větší odlišnost. Pro účely našeho zkoumání je naprosto nezbytné zachovat podmínku, aby zkoumaný mluvčí hovořil rodným jazykem. Použitý jazyk nesmí vyvolávat úsilí, respektive emoční tlak, aby mluvčí neudělal chybu. To je poněkud choulostivá stránka věci, protože zkoumaný mluvčí by měl být, pokud možno, alespoň jistou chvíli fyzicky, psychicky i emocionálně v klidu. Opačný případ by samozřejmě limitoval pravděpodobnost správného závěru analýzy.
EURO: Kde všude lze využít tento software založený na technologii LVA? MOROZ: Nejrozšířenější užití softwarových aplikací firmy Nemesysco, založených na technologii LVA, je v oblasti zvané CRM (Customer Relationship Management, neboli řízení, správa vztahů s klienty). Zahrnuje oblast personalistiky, prevence pojišťovacích podvodů, analýzy rizik, sledování kvality služeb a spokojenosti zákazníků. Bezpečnostní a zpravodajská oblast zase asi nejvíce ocení všechny skryté možnosti tohoto systému, od bezpečnostních prověrek, analýzy výslechů a odposlechů až po nasazení v integrovaném záchranném systému na lince 112. Obrovský význam bude mít jeho rozšíření v medicíně. Produkty, určené pro zábavní průmysl, budou zase zajímavé komerčně.
EURO: Jaké jsou technické, právní a etické limity použití tohoto softwaru? MOROZ: Technickým limitem je pouze kvalita nahrávky. Běžný telefonický hlasový přenos lze kvalitně analyzovat. Nekvalitní nahrávku systém automaticky odmítne zpracovat pro nedostatek relevantních dat. Při analýze záznamu nižší kvality je tato okolnost obsažena v závěrečném vyhodnocení. Co se právních aspektů týče, musíme odlišit veřejně přístupné nahrávky a zvuk získaný privátně. Podstatnou okolností je existence práva pořizovat zvukový záznam. V případě telefonických rozhovorů je dostatečné upozornění, běžně užívané mnohými operátory call-center, že v rámci sledování kvality mohou být rozhovory nahrávány. Výsledky hlasové frekvenční analýzy nejsou (zatím?) procesně využitelné, s výjimkou Jihoafrické republiky. Etické limity jsou značné a po pravdě řečeno, ještě zdaleka nevytyčené. Jde například o používání veřejně dostupných nahrávek.
EURO: Jaká je dostupnost tohoto softwaru u nás? MOROZ: Společnost Moroz & Partner je výhradním zástupcem firmy Nemesysco pro Českou republiku a Slovensko. Máme oprávnění software prodávat, ale také nabízet službu, spočívající v provedení hlasové analýzy našimi experty. Běžné komerční varianty, které neumožňují provádění hloubkové analýzy, ale poskytují pouze vizuální či akustické upozornění ve chvílích, kdy software vyhodnotí přítomnost rizikových příznaků, můžeme prodávat zcela volně. Některé pojišťovny si například pořizují na call-centra systém RA5, který operátorům slouží jako indikátor možných pojistných podvodů. Problematická hlášení systém automaticky posílá na analytické pracoviště, které k určení směru dalšího šetření provede hloubkovou analýzu pomocí systému LVA-6.50. Prodej tohoto softwaru však vyžaduje souhlas izraelského ministerstva obrany. Navíc jsme vázáni dalšími podmínkami. Software například nesmíme prodávat médiím či politickým stranám.
EURO: Jaké jsou možnosti zneužití tohoto systému? A jaké jsou možnosti obrany? MOROZ: Nebezpečí nespočívá v systému, ale v lidech. Proto je jedinou obranou trochu restriktivní a uvážlivá obchodní politika. Kromě podmínek izraelské strany máme ještě vlastní, interní pravidla. Kdyby Izraelci dle vlastních poznatků neměli důvod někomu produkt neprodat a my bychom ke stejnému subjektu měli rizikové poznatky, pak software prostě neprodáme. Každý držitel licence se navíc zavazuje k užití softwaru pouze v rámci vlastní působnosti a vlastního šetření. Výslovně jde třeba o závazek neanalyzovat nic, co by uniklo z probíhajících policejních vyšetřování, aby nedošlo k jejich ovlivnění.
EURO: A co kauzy odložené či zastavené? MOROZ: Tam je situace mnohem zajímavější. Například firma, reprezentující Nemesysco v Jihoafrické republice, přímo dostává od policie takzvané „cold cases“ a jako soukromý subjekt provádí pro policii analýzu těchto odložených případů. Dostanou policejní spis, mají právo provést výslech klíčových svědků, aby získali zvukový materiál, který pak analyzují. Za úspěšné vyřešení případu dostávají od státu přesně stanovenou odměnu.
EURO: Lze tedy publikovat nějaké analytické výsledky, získané pomocí tohoto softwaru? MOROZ: Nelze. Každý majitel licence smí produkt používat pouze pro své vnitřní účely. Ale to neznamená, že nemůže veřejně deklarovat, že tento software má a aplikuje! Ve Velké Británii začalo tuto technologii přibližně ve stejné době používat více než patnáct pojišťoven. Odhalenost pojistných podvodů se zvýšila téměř o dvacet procent. Některé z pojišťoven zveřejnily, že používají tento systém - a u nich klesl jak počet hlášených pojistných událostí, tak především pokusů o pojistný podvod. Klientů neubylo, naopak. Jsou totiž spokojeni, že díky větší efektivitě vyřizování pojistných nároků se zkrátila průměrná doba od nahlášení pojistné události po vyplacení peněz.
EURO: Zkoumali jste jistě mnoho zajímavých nahrávek. Můžete sdělit své dojmy? MOROZ: Jistě, zkoumali. A docela jsme se u toho bavili. Překvapením nebyly ani tak zjištěné výsledky jako jejich přesvědčivost. I u dojmů však dodržujeme pravidlo, kterým je výpůjčka od Járy Cimrmana: Nesmíme ani naznačovat. Jediné, co mohu konstatovat, je, že z pohledu mého i mých velmi zkušených kolegů funguje tato technologie dokonale.
Důrazy
Nejde o klasický stresový analyzátor.
Na rozdíl od polygrafu nejde o invazivní technologii.
Software rozkládá hlas do vrstev, které odpovídají výskytu emocí.
Software pracuje s podvědomými projevy emocí i v neslyšitelných frekvencích.
Špičková verze softwaru podléhá přísným licenčním podmínkám.
Software lze používat pouze pro deklarované účely.
Výsledkem není detekce lži, ale vyhodnocení rizikových příznaků.
Souvislosti
Brýle firmy V Entertainment by změnily leckterý parlament v lunapark.
Software se nesmí poskytovat médiím a politickým stranám.
Použitá technologie má obrovské využití v medicíně.
Software byl původně vyvinut pro odhalování neoprávněných žádostí o sociální dávky.
Bezpečnostní prověrkou systémem LVA by prošel jen němý špión.
Diagram 1:
Rozhraní programu LVA-6.50
Grafy zobrazují změny jednotlivých složek stresu v čase v průběhu analyzovaného záznamu hlasu Jiřího Kajínka (extrémní stres)
Stres při lhaní
Pravděpodobnost lhaní
Globální reakce
Globální stres
Kognitivní lhaní
Emoční stres
Úroveň myšlení
Úroveň modulace hlasu
Say or stop stres
Pramen: Moroz & Partner
Diagram 2:
Zobrazení v softwaru LVA-6.50
Spektrogram hlasu (muž, 50let), který říká větu „Jan Schneider píše pro týdeník Euro“*
0 1 2 3 4 5 6 7 8 9 10 kHZ
Čas
Pozn.: Je možné rozeznat jednotlivá slova. Barva popisuje úroveň dané frekvenční složky v konkrétním okamžiku - čím tmavší barva, tím nižší úroveň, čím světlejší, tím vyšší. Z obrázku je vidět, že záznam hlasu obsahuje mnohem více informací, než tvoří pouhý význam vyřčených slov.
Pramen: Moroz & Partner
Diagram 3:
Hlas ve zvukovém editoru
Zobrazení věty „Jan Schneider píše pro týdeník Euro“ bez rozkladu na jednotlivé frekvenční složky
Intenzita
Čas
Pramen: Moroz & Partner
Box 1:
Co je to lež?
Lež je jednání, jímž mluvčí úmyslně zkresluje nebo zastírá, o čem ví, že je pravdivé.
Lež má zpravidla za následek něčí oklamání za účelem získání určité výhody.
Určitý druh „společenské“ lži je v některých kulturních okruzích součástí komunikace mezi lidmi, je převážně akceptován a není chápán jako negativní jev (někdy je dokonce téměř vyžadován). Od konverzačních blábolů typu „Vám to dnes sluší, paní vedoucí“ (i když dotyčná připomíná strašáka do zelí) až po odpovědi na otázku „Jak se máte?“ - „Děkuji, dobře“ (i když mluvčí právě uvažuje o sebevraždě). I s pomocí těchto lží lze dosáhnout výhod - kariérního postupu a tak dále.
Lež, aby fungovala, musí dodržovat určitá pravidla - být v souladu s fakty, známými protistraně; mít zjevnou a pochopitelnou vnitřní logiku; nesmí do ní být vědomě zasvěcena žádná třetí osoba.
Typickým případem, kdy lež může úspěšně ochránit například pachatele vraždy, je „záhada zamčeného pokoje“. (Tedy situace, kdy jsou k jedné oběti dva potenciální vrazi, každý se svou verzí události, přičemž obě dvě jsou v souladu s fakty, jež zná vyšetřovatel.) V případě inteligentního lháře zbývá k jeho odhalení zkouška na polygrafu; odmítne-li ji, pak zbývá již jen vyšetření emočního stavu pomocí LVA.
Lež využívají dokonce i společensky uznávané instituce - zpravodajské služby, jejichž posláním je získávat informace od osob, které však nevědí, s kým ve skutečnosti mluví. Zpravodajci se přímo školí v budování legend, což není nic jiného než pečlivě připravená kvalitní lež. Již Hugo Grotius (1583-1645) však navrhoval rozlišovat mezi lží jako neoprávněným lhaním a takzvaným falsifiqium, oprávněným lhaním.
Box 2:
Firma Nemesysco
Sídlí v izraelském městě Natania. Od svého vzniku v roce 2000 vyvinula mnoho nejrůznějších aplikací, jejichž základem je patentovaná technologie analýzy frekvenčních hlasových vrstev (Layer Voice Analysis, LVA). Firma poprvé demonstrovala účinnost analytického softwaru, založeného na této technologii, v oblasti prevence zneužívání sociálních dávek. Její úspěch pochopitelně neunikl pozornosti vojenských složek a následný vývoj bezpečnostních aplikací katapultoval firmu mezi špičkové světové výrobce analytických technologií. Firma Nemesysco uvádí na svých webových stránkách obrovskou škálu možností využití své sofistikované technologie. Současně však poskytuje odkazy na poměrně kontroverzní reakce z nejrůznějších stran, týkající se právě její aplikace. Je zřejmé, že jde o společnost, jejíž prioritou není pouze to, co je „technicky svůdné“, ale která současně reflektuje i celý komplex souvisejících jevů.
Box 3:
Šíře softwarového využití technologie LVA
System LVA-i
Určen pro personalistiku, protože zajišťuje optimální a nezaujatou prověrku integrity a rizik jak u současných zaměstnanců, tak nových uchazečů.
System Risk Analysis RA5
Určen k prevenci podvodů. Je užíván pro zjišťování rizikových příznaků u všech příchozích hovorů, zejména do finančních institucí. Operátora v centru tísňového volání, který je odkázán pouze na vlastní intuici a zkušenost, systém diskrétně (vizuálně nebo akusticky) upozorní na přítomnost rizikových příznaků v hlase volajícího. To mu umožní minimalizovat nebezpečí, že vyšle zdravotníky a hasiče na planou hlášku, a ti pak mohou v tomtéž čase chybět jinde.
System Quality Assurance QA5
Je založen na detekci emocí při klientském volání na call-centrum. Dokáže supervizora v reálném čase upozornit na to, že se nějaký rozhovor emocionálně vyhrocuje. Systém automaticky vyhodnocuje vývoj emocionálního rozpoložení klienta a ukončené hovory označuje příznaky „úspěšný“, „problematický“ a tak dále. Ve spojení s výukovým modulem je toto řešení monitoringu call-center bezesporu bezkonkurenční. Nelze ovšem opominout ani obrovské zpřesnění výzkumů veřejného mínění, když se s použitím této technologie vyloučí „neupřímné“ odpovědi.
System Gate Keeper GK1
Lze použít na letišti jak při odbavování cestujících, tak při jejich nástupu do letadla. Využijí jej celníci, pohraniční policie, vězeňská stráž, ostraha při vstupech do budov a dalších zařízení vyšší důležitosti. Výstupy tohoto terénního systému jsou velmi jednoduché a slouží k určení pravděpodobnosti, zda deklarovaný účel vstupu kontrolované osoby je legitimní. Osoba, u které systém vykáže alarmující příznak, samozřejmě není ihned vyloučena z dopravy či nevpuštěna do budovy, ale je podrobena detailnější prověrce.
System LVA-6.50
Software, založený na využívání pokročilé, bezpečnostní úrovně technologie LVA a poskytuje proškoleným uživatelům snadné ověření míry pravdomluvnosti a emocí zkoumané osoby. Je určen nejen pro státní organizace zpravodajské, bezpečnostní, policejní, imigrační a celní, ale i pro prověřené privátní vyšetřovatele. Systém pracuje v modech on-line, off-line a vyšetřovacím (formulář s předdefinovanými otázkami podobně jako u polygrafu). Vyšetřovatelé všech typů zde mají k dispozici nástroj, u něhož je poměrně obtížné šetřit superlativy.
Security Call Analyzer SCA1
Mocný zpravodajský nástroj, který maximálně těží z výhod charakteristiky užité technologie. Zpravodajské služby jsou schopné zachytit neuvěřitelné objemy komunikace, což ale samo o sobě problém zajištění národní bezpečnosti neřeší. Naopak, hovorů vytříděných pouze dle „slovníkových“ příznaků je tolik, že je prostě nelze v reálném čase vyhodnotit, čímž neuvěřitelně klesá efektivita systému. Pro příklad nemusíme chodit daleko: O tomto systému leckdo do telefonu řekne: „No, to je bomba.“ Zpravodajci výrok zachytí a budou analyzovat. Zbytečně. SCA1 proto provede ještě následnou selekci vytříděných hovorů dle „mentálního stavu hovořících“. Tím se množina skutečně relevantních hovorů sníží na počet, který je možno analyzovat v reálném čase.
V medicíně má tato technologie skvělé výsledky v oblasti omezování úzkostných stavů (Cognitive-Behavioral Therapy) nebo u metod léčení, kde je třeba, aby pacient sděloval naprosto přesně své stavy (Dynamic Treatment Modalities). Podobně je tomu tam, kde je přesně třeba při terapii určit bolestivost některých postupů. Obrovským pomocníkem může být tato technologie pro ty, kdo rozhodují o podmínečném propuštění například sexuálních násilníků. Zde může významně pomoci zjistit, zda absolvovaná terapie byla skutečně úspěšná. Pracovní psychologové mohou touto metodou obohatit své vyšetřování pracovního stresu a absentérství, což jim umožní oddělit závažné případy a včas v nich intervenovat. V současné době firma zkoumá možnost vývoje analýzy, založené na hlasových příznacích osobnostních poruch.
Komerčně zajímavé je využití této technologie v zábavním průmyslu. Produkt ex-Sense je analyzátor hlasových emocí pro snadné, rychlé a relativně věrohodné vyhodnocení důvěryhodnosti hovorů včetně telefonních. V podobě počítačového softwaru nebo mobilní služby je dostupná takzvaná Love Detector technology, zjišťující stabilnost a charakter hlasových změn u zamilovaných, respektive zamilovanost předstírajících. V Austrálii a v Německu technologii používají v Big Brotherovi. Přestože tyto aplikace jsou určeny výhradně pro zábavu, principiálně pracují na základě stejně sofistikované technologie jako špionážní aplikace.