Hitem budoucnosti budou programy, které dodají datům smysl, říká Jeff Jonas, šéf výzkumu IBM Entity Analytics.
Jeff Jonas úplně neodpovídá klasické představě analytika ve velké korporaci. I když se jako hlavní výzkumník ve skupině IBM Entity Analytics věnuje složitým technologiím, dokáže o nich s humorem vyprávět tak, že je pochopí každý.
„Za těch sto let, co IBM existuje, přišla řada neskutečných inovací a věřte mi, objeví se ještě spousta neuvěřitelných novinek,“ říká Jonas, když přibližuje práci na projektu G2, který v budoucnu pomůže dodat smysl obrovské záplavě dat, jež lidstvo produkuje.
Technologie, která jednou ušetří peníze podnikům, zjednoduší život lidem a pomůže vědcům bránit Zemi před asteroidy, je přitom inspirována programy společnosti firmy SRD, kterou založil ve svých dvaceti letech a zpočátku ji provozoval ze svého vlastního auta.
EURO: Existuje vůbec nějaká IT firma, která se nerozjížděla z auta nebo z garáže? Je jich poměrně dost, ale je to evidentně populární trend. Prakticky po celou dobu existence SRD jsem chodil po firmách a vyvíjel pro ně programy na míru. Od našeho přestěhování do Las Vegas jsme dělali i pro kasina. Jedním ze zajímavých programů byla NORA (Non Obvious Relationship Awareness) – upozorňovala na souvislosti, kterých si na první pohled nevšimnete.
EURO: Jak to fungovalo? V podstatě ten program nakrmíte daty, jako jsou jména, adresy, telefonní čísla, on je pak dává dohromady a hlídá. Mohl třeba narazit na dva lidi, kteří měli stejné křestní jméno a adresu a jeden z nich byl na seznamu nežádoucích osob, které když v kasinu nachytají, může to pro podnik znamenat ztrátu licence. Pak začala NORA nacházet podezřelé spojitosti se zaměstnanci kasina – že třeba velcí výherci měli nějaký vztah s lidmi z marketingu. V roce 2001 si programu všimla i vláda a investovala do něj, aby ho mohla využít k hledání zločinců napříč různými organizacemi.
EURO: Našel nějaké? Ten program provozují sami a s přesnými výsledky se moc nechlubí. Ale občas se mi stalo, že mi někdo ukázal noviny a řekl, že bych „na sebe měl být pyšný“. I když firma SRD produkovala široké spektrum programů, kvůli systému NORA si mě v roce 2005 všimlo i IBM.
EURO: IBM utratila za posledních pár let zhruba čtrnáct miliard dolarů na podobné akvizice. Jaká část z toho padla na vaši firmu? IBM investovala jak do nákupu firem, tak do vlastního vývoje. Za mou firmu dali jen velmi malou část. Procenta vám nepovím, ale mně to stačilo. Nabídli mi místo na dva roky a asi nečekali, že zůstanu. Ale jsem tu pořád, ta práce mě prostě baví. Shrnul bych to tak, že se zabývám systémy, které dodávají datům smysl a upozorňují na důležité informace. Pracuji teď na technologii další generace G2, která by měla být mezi mými vynálezy poprvé i zvědavá.
EURO: Jakým způsobem? Když dáte dohromady spoustu dat, objeví se velké množství „možná“ – na většině z nich ale nezáleží. Například chce-li banka zabránit podvodům, může najít lidi, kteří spolu mají „možná“ něco společného. Vztah ale začne být podezřelý, až když by mohl mít pro banku špatné důsledky. Součástí mého nového projektu bude i to, že když objeví nebezpečné „možná“, bude se sám snažit najít další informace, aby se hrozba potvrdila nebo vyvrátila.
EURO: V reálném světě se lidé často rozhodují automaticky – například jestli je bezpečné přejít ulici. Neztrácejí tuto schopnost v prostředí on-line světa? Problémem je prakticky nekonečné množství dat. Podle Erica Schmidta z Googlu se každé dva dny vyprodukuje tolik dat, kolik vzniklo od začátku civilizace do roku 2003. Naše možnosti je zanalyzovat, se ale nezvyšují. Já se snažím ve svém projektu najít technologii, která by uměla poradit, kam je dobré zaměřit pozornost. Také by měla různým údajům dodat smysl tím, že je zařadí do souvislostí a všechno to bude dělat v reálném čase. Pak se však také ukáže, že se některá data hodí akorát k ignorování nebo smazání. Jako když čekáte na přechodu – zajímá vás jen, že přijíždí auto a většinou vám může být jedno, co je to za značku.
EURO: To už zní jako umělá inteligence…. To, co teď dělám, jednou bude možná krokem k něčemu podobnému. Ideje umělé inteligence mi zatím nepřijdou praktické a já chci dělat něco, co je důležité. Třeba pomoci zásilkovým firmám zefektivnit provoz, ulehčit tak jejich rozpočtu, ale i životnímu prostředí. Nebo pomoci vědcům určit jestli náhodou některý z pozorovaných asteroidů nemíří k Zemi.
EURO: Chcete tím říct, že to všechno můžete dělat s pomocí jednoho programu? Ano, přišel jsem na to, že tyto různé věci – asteroidy, dodávky zásilkové společnosti, kriminálníci nebo buňky hrozící rakovinou – jsou v podstatě to samé.
EURO: Prosím?
Začíná to schopností expertního počítání. Třeba ta zásilková firma může mít patnáct systémů a každý sleduje něco jiného. Aby byla ale opravdu efektivní, potřebuje jeden, který přesně spočítá dodávky, zákazníky, řidiče, jejich trasy i pohyb. U asteroidů chcete spočítat, která ze světýlek na obrázcích teleskopu se pohybují, určit jejich vzdálenost a dobrat se trajektorie jejich pohybu.
Můj systém to v podstatě zobecní, obojí bere jako entity, které mají lehce odlišné vlastnosti. S pomocí zvláštního algoritmu a způsobu ukládání dat pak můžete lépe odhadovat budoucí dění prakticky v jakémkoliv oboru.
EURO: Jenže když budou mít třeba pojišťovny příliš mnoho údajů, které jim technologie poskládá ze všech možných zdrojů, dostane pak ještě někdo někdy vůbec pojistku? Do budoucna se budou předpovědi upřesňovat stále více až tak, že se budeme muset rozhodnout, jestli ten výsledek vůbec chceme znát. Společnost si bude muset tenhle problém vyřešit. Čím více se o tom bude mezi lidmi vědět a diskutovat, tím mají větší šanci, že budou součástí toho rozhodnutí a neučiní je za ně pojišťovny nebo třeba vlády. Bude se muset upravit i to, komu všemu zpracovaná data můžete poskytnout.
EURO: Když budou technologie pořád chytřejší, nebudou mě obírat o možnost volby? Myslím, že v některých případech naše svobody spíše rozšiřují. Když vezmete technologii obecně, máme díky ní více volného času, delší život. Technologie sama o sobě není špatná, záleží na tom, kdo a jak ji využívá.
EURO: Ale kvůli ní se ani nemusíme učit, všechno stačí vygooglovat. Pokud jste potřebovali jen rychlou odpověď, je váš život díky tomu efektivnější. Když se chcete učit víc do hloubky, tu možnost vám nikdo nebere. Technologie neuvěřitelně rozšiřuje i možnosti volby obecně. Jen se zdá, že o to většina lidí nemá zájem.
EURO: S tím souvisejí i personifikované reklamy, které nabídku šijí na tělo. Kam až to podle vás může zajít? Vám by se nelíbilo, kdyby se k vám dostaly jen reklamy udělané opravdu na míru třeba i s ohledem na váš rozpočet? Může pak být i taková agentura, která vám nebude cpát reklamu každých pár minut, ale třeba jednou za čas doporučí něco přesně pro vás. Byla by pak v podstatě jako váš kamarád. Nakonec jí můžete svěřit své nákupy úplně. A zase budete mít více času na něco jiného.
EURO: Podobně cílenějšími a chytřejšími se ale mohou stát i internetové podvody typu nigerijských dopisů. Dá se tomu nějak zabránit? Kyberzločinu, který ročně ukořistí zhruba bilion dolarů, by se měla obávat jakákoliv organizace i jednotlivci, kteří mají k dispozici hodnotná data, třeba údaje o svých zákaznících. Když ti podvodníci vydělávají tolik už teď, budou se chtít také zlepšit. Věnuji se ale i ochraně údajů, ty se dají například anonymizovat.
EURO: Jakým způsobem?
Pokud je ukládáte, nemají čitelné označení. Představte si to, jako že na sobě mají takovou „šipku“, která program nasměruje tam, kde jsou uložená původní data. Originální čitelná data sice někde jsou, ale znamená to méně kopií a menší riziko úniku dat. Můžete si to představit takhle: „šipky“ jsou v podstatě jako identifikační kartička knihy v knihovně. Dojdete s ní k pultíku, ale výtisk dostanete, až když si budou jistí, kdo jste, proč ho chcete a co s ním budete dělat. Takový počítačový program se dá zavést a na existující systémy to bude mít malý dopad.
Pracuje se i na tom, aby každý údaj na sobě měl určité kontrolní prvky, ale aby to mohlo globálně fungovat, musela by se upravit v podstatě každá citlivá informace. A to asi neuspěje – pokud by se pro úspěšné fungování nové technologie musel upravit každý systém na Zemi, tak se tato inovace s největší pravděpodobností nikdy neuchytí.
EURO: To je součástí konceptu Privacy by Design? Ano. Já se tomuto konceptu, kdy jsou nové technologie od začátku budovány s důrazem na ochranu soukromí, věnoval, ještě než se přišlo s tímto názvem. Měla je v sobě zabudované i zmiňovaná NORA. U některých ochranných systémů technologie G2, kterou teď rozvíjím, je specifické to, že se nedají vypnout. G2 by v sobě měla mít více ochranných prvků než jakýkoliv existující systém. Ale pokud teď někdo přijde s tím, že jeho program má bezpečnostních prvků více, je to jedině dobře. Taková konkurence prospěje všem.
EURO: Pokud to ovšem budou chtít společnosti, které ty programy kupují. Nebo ne? Momentálně to sice funguje tak, že za nadstandardní ochranu soukromí si musíte připlatit jako jednotlivec i organizace. Do budoucna to ale trend nebude a i nadstandardní ochrana soukromí se snad stane součástí základní ceny.
Šéf výzkumu IBM Entiny Analytics
Jeff Jonas
odešel ze střední školy rok před maturitou, protože už se s počítači nemohl naučit nic dalšího. Svoje schopnosti rozvíjel praxí, když si v sedmnácti založil první firmu. Jeho druhá společnost SRD vyvíjela pro firmy software na zakázku a proslavila se například programem, který kasinům umožnil odhalit karetní podvodníky.
Když IBM koupila SRD, ve firmě zůstal a vyvíjí technologie budoucnosti. Kromě toho se také angažuje v aktivitách souvisejících s ochranou soukromých údajů.
Je svobodný otec tří dětí, kvůli své práci hodně cestuje a po světě závodí v triatlonu Ironman.