Badatel Microsoftu a jeho tým podnikají překvapivý nový útok na AIDS
Levné léky proti bolestem! Nevyzvednuté majetky v Nigérii!! Většina z nás rychle pozná, že takovéto e-maily jsou spamy. Jak byste ale této dovednosti naučili stroj? To chtěl zjistit David Heckerman. Na začátku této dekády vedl tým divize Microsoft Research, který se zabýval ochranou před spamy. Aby členové týmu vytvořili nástroj, zmapovali přepečlivě tisíce signálů naznačujících, že nějaká zpráva může být smetím. Například e-mail, kde figurovala „Viagra“, byl zaručeně spam – ale věci se rychle zkomplikovaly.
Když spameři viděli, že se zprávy se slovem „Viagra“ ničí, přešli na tvary V1agra nebo Vi agra. Vypadalo to skoro tak, že spam mutuje. Jako kdyby byl živý.
Tato paralela mezi spamem a biologií rezonovala u Heckermana, lékaře a zároveň držitele doktorátu v oboru počítačových věd. Netrvalo dlouho a uvědomil si, že jeho nástroj na ochranu před spamem by mohl najít uplatnění daleko mimo rámec e-mailové „špíny“, a sice v oblasti biologických věd. V roce 2003 překvapil kolegy ve washingtonském Redmondu tím, že technologii na ochranu před spamem nově zaměřil na jeden z nejvražednějších a nejrychleji mutujících hlavolamů na světě: na virus HIV, který vede k onemocnění AIDS.
Heckerman se zabral do medicíny – a vzal si na pomoc Microsoft. Když se svým plánem přišel za Billem Gatesem, předsedu společnosti to „opravdu nadchlo“, vzpomíná Heckerman. Gates, který se dobře obeznámil s problematikou HIV při své dobročinné práci, dal Heckermana dohromady s badateli zkoumajícími AIDS v Massachusettské všeobecné nemocnici, na Washingtonské univerzitě i jinde.
Od té doby padesátiletý Heckerman a dva jeho kolegové vytvořili v Microsoftu vlastní biologické pracoviště, kde vytvářejí software na detekování HIV. Jde o výzkumné nástroje na zjišťování infikovaných buněk a dávání virových mutací do vzájemného vztahu s genetickým profilem jednotlivce. Heckermanův tým projíždí hory dat přes obrovské skupiny 320 počítačů, jež pracují souběžně. Díky rafinovanějším algoritmům a silnějším strojům prosívají data 480krát rychleji než před rokem. V červnu tým zveřejnil zdarma na internetu svůj první balík nástrojů.
Jde o nové odvětví na zdolání netvora? Ne tak docela. Heckermanův kout v Redmondu představuje pouze jeden malý uzel v celosvětovém výzkumném úsilí v oblasti AIDS, jež se vyznačuje rozsáhlou spoluprací. „Skupina Microsoftu má odlišné hledisko a dobré statistické zázemí,“ uvádí Bette Korber, který zkoumá HIV v Národních laboratořích Los Alamos. Nejtěžším oříškem, před kterým všichni stojí, je sám virus, který je prohnanější než kterýkoli z korporátních nepřátel Microsoftu. Heckerman pevně věří, že jeho nástroje do tří let povedou k vakcínám, jež bude možné testovat u lidí, ale jeho výzkum není součástí podnikatelského plánu Microsoftu. „Nemá s Microsoftem nic společného,“ prohlašuje, „kromě toho, že můžeme pomoci.“ Z hlediska firmy odpovídají částky investované do výzkumu HIV chybě v zaokrouhlování – v rozpočtu pro výzkum a vývoj ve výši sedmi miliard dolarů činí jen dva miliony dolarů ročně. Potenciálním výnosem by byl příspěvek k „svatému grálu“ výzkumu AIDS, k úspěšným vakcínám. V optimálním scénáři by farmaceutické společnosti takovýto výzkum zakomponovaly do cílených typů vakcín, což by miliony lidí na celém světě ochránilo před metlou AIDS. Jaký by byl obchodní výnos? No, pokud vítězství nad epidemií neospravedlňuje vynaložené úsilí – a neleští image Microsoftu – mohlo by se třeba stát, že nástroj schopný vyslídit virus si poradí i se spamem.
Jestliže se zdá divné, že by nástroje na ochranu před spamem nakonec zkoumaly nukleové kyseliny, tak by se to zdát nemělo. Výzkum stále kvantitativně roste. Téměř všechno, od atomů a buněk výš, je dnes popsáno v datech. Když je součástí práce hledání statistických vztahů v horách bitů, dochází ke dvěma věcem. Zaprvé, rozhodující vliv získávají matematikové a počítačoví odborníci, což pro hybné síly jako Microsoft a IBM znamená větší úlohu ve výzkumu. Zadruhé, protože badatelé nalézají společné modely, začínají skákat z jedné disciplíny na další.
VÝPOČET PRAVDĚPODOBNOSTI
Bitva proti HIV přitahuje spousty takových skokanů. Například několik vědců v Los Alamos učilo stroje rozeznávat modely v satelitních snímcích. To je přivedlo k HIV, kde vytvářejí nástroje v intencích Microsoftu. A mnozí z 800 badatelů v Microsoftu různě překračují hranice disciplín. Jeden z nich, Michael Cohen, se pustil do vytváření softwaru na spojování fotografií do panoramatu. V současnosti skládá tisíce snímků mozku do 3D vědeckých modelů.
Spojitosti mezi spamem a HIV jsou pro Heckermana v podstatě matematikou. Provádí analýzu obou pohrom tak, že zkoumá statistické vztahy mezi jejich stále se měnícími znaky. Vezměme si slovo „Viagra“. Někdy se objevuje v normálních e-mailech. Často figuruje ve spamech. Když badatelé prozkoumají tisíce e-mailů, mohou vypočítat procento e-mailů s tímto slovem, které jsou spamy. To je jedna cesta. Jenže stroj na filtrování spamu potřebuje vědět více než tohle. Jaké další znaky v e-mailu signalizují, že jde o spam? Jsou určité fonty obzvlášť spamové? A co e-mailové adresy nebo typy interpunkce? Vtip je v tom, přijít na to, které kombinace těchto znaků identifikují e-mail jako spam. Každé rozhodnutí může zahrnovat tisíce proměnných a miliony různých výpočtů.
Z Heckermanova hlediska je HIV jako vychytralý rozesílatel spamu. Když zaútočí na buňku, vpíchne do ní svůj genetický materiál a pokračuje (velmi podobně jako programátor spamu, který si zabral nechráněný počítač) tím, že vytváří tisíce kopií viru. Je to notoricky ledabylý kopista, ale to mu ještě přidává na síle. Každá chyba vypouští do systému mutantní viry. Mnohé neuspějí. Některé však přežijí – a ubrání se lékům.
Jedním z úkolů vědců zkoumajících HIV je najít proměnné, které indikují infikovanou buňku. Prvními vodítky – buněčnými ekvivalenty obměn fontů a slov, které Heckerman objevil při výzkumu spamu – jsou zpravidla kousky proteinu usazené na vrcholku každé buňky. Ty sdělují kolemjdoucím včetně houfů protilátek, co se děje uvnitř buňky. Badatelé se léta snaží nalézt kombinace proteinu, které upozorňují na buňku infikovanou virem HIV. Jakmile se jim to podaří, dalším krokem bude zabalit tyto kousky proteinu do vakcíny. Teoreticky by to imunitnímu systému člověka ohlásilo celou skupinu nežádoucích živlů, aby tyto buňky rozpoznal a zaútočil na ně.
V čem je potíž? Ve složitosti a mutacích. Buňky nakažené virem HIV často mají mutované jmenovky, které se imunitní systémy nenaučily číst. V tomto smyslu jsou vakcíny jako vadné spamové filtry, které blokují e-maily propagující „Viagru“ a propouštějí inzeráty na „V1agru“. To vede některé badatele k tomu, že se vzdávají. „Do černé díry vakcín proti AIDS jsme už nasypali miliardy,“ lamentuje Leroy Hood, spoluzakladatel Ústavu systémové biologie v Seattlu.
Heckerman je však optimistou. Tvrdí, že zvyšováním počítačové síly a spojováním tisíců nových proměnných – včetně obrovských genetických rozdílů u každého pacienta – badatelé postupují vpřed. Jedním z klíčů je podle něho zmapování modelů mutace a jejich začlenění do medicíny. Uvádí, že tyto mutace se různí podle imunitního systému člověka. Když se badatelům podaří tyto modely najít, budou blíže k vytvoření účinných vakcín. Pakliže ale dojdou k závěru, že mutace jsou zcela nahodilé, „budeme ve velkém průšvihu,“ prohlašuje Heckerman.
Hledání pokračuje. Nikdo nespoléhá na to, že Microsoft přijde na zázračné řešení. Avšak ve výzkumné komunitě zoufale toužící po odpovědích je bzučení počítačů běžících v Redmondu vítaným zvukem.