Menu Zavřít

Stůjte, jste podezřelý!

14. 5. 2008
Autor: Euro.cz

Vědci z VUT Brno zkoumají uplatnění videa pro bezpečnostní účely

[perex]
Po nástupišti metra se plouží postava. Není ani moc nápadná; dispečera MHD by asi nijak nezaujala, natož aby vyhlásil poplach… Jenže počítač sledující pozorně kamerový systém ve stanici sám vyhodnotí pohyb individua jako nezvyklý: do minulého vlaku nenastoupil, motá se mimo běžnou trajektorii cestujících. Je to opilec? Sebevrah? Terorista?? To už musí rozřešit dozorčí, před nímž se co nevidět rozsvítí varovná kontrolka.

Počítačová grafika neslouží pouze architektům, sazečům nebo mladíkům, kteří v počítačových hrách střílejí stále prokreslenější příšerky. Její užití je širší. A užitečnější. Může taktéž zachraňovat životy. Řekne-li se rozpoznávání videa, ihned nám vytanou na mysli filmové thrillery, v nichž si političtí mocipáni hrají na Velké bratry. Vědci z Ústavu počítačové grafiky a multimédií (ÚPGM) z brněnské Fakulty informačních technologií VUT (FIT) si na nic hrát nemusejí; spoustu toho už své mašinky naučili.

Výcuc bez meškání

„Mimo jiné se soustřeďujeme na sumarizaci videosekvencí, čili jak dlouhé záznamy z konferencí obsáhnout, sestříhat a zkrátit, aby měl uživatel obrazových databází rychlý přehled,“ říká docent Pavel Zemčík z ÚPGM a proděkan pro vnější vztahy FIT. Loni se Brňané zúčastnili evaluací americké organizace NIST a v programu TrecVid, jenž zahrnoval vyhodnocování v automatizované sumarizaci nahrávek či rozlišení 40 kategorií videozáznamů (od sportovních přenosů po televizní zprávy), se z dvacítky světových pracovišť umístili v prvé třetině. Skupina Graph@FIT byla hodnocena coby „advanced center“.
Se sumarizací souvisí i účast v projektu AMIDA, na němž se podílí též řečová skupina FIT (EURO 9/2008). Cílem je monitorovat a indexovat firemní mítinky, aby se v nich dalo vyhledávat nejen dle klíčových slov ze zvukového záznamu. „Z videosekvencí extrahujeme různé příznaky, které můžou sloužit k vyhledávání v databázích,“ říká Zemčík. Naučené programy mohou samy určit, kdo se jak pohyboval, jaká byla gesta, zda nejde odvodit, co se tehdy řešilo a tak dále, což může mít dalekosáhlé uplatnění u globálních firem. Až se šéf optá: Kdy se to rozhodlo, odpověď z digitalizovaného souboru získá během chvilky. Není divu, že katedra spolupracuje na vývoji videokonferencí i s průmyslem a telekomunikačními firmami.

Bezpečnost především

Další specializací IT grafiků ze skupiny Graph@FIT je rozpoznávání objektů a událostí z videosekvencí, což se hodí pro hledání a – žádný div – bezpečnostní účely. Počítač se musí nejprve naučit, jak věci kategorizovat. Příklad? Pokud chcete vyhledávat na videu dejme tomu FOŤÁK, musíte do PC dodat metodou strojového učení dostatečné množství fotek různých přístrojů ve 2D a uplatnit je v „rozpoznávačích“. Jiným postupem je na dotyčném objektu najít typické body, hrany, vrcholy, nápisy, zadat jejich polohu, aby počítač hledal v databázi kombinace, jež spolu souvisejí, údaje zobecní a předmět pozná. Adam Herout, zástupce vedoucího ÚPGM, říká: „Potřebujeme poměrně rozsáhlé archivy snímků objektů, tisíce jedné kategorie, aby je počítače uměly poznat a zobecnit.“ Spousty obličejů, aut, bicyklů, psů… Nač?
Jedním z projektů, na němž moravští odborníci pracují, je CARETAKER. Zaměřuje se na bezpečnost ve veřejných prostorech, konkrétně jde o cvičné nahrávky z podzemky v Římě a Turíně. A jsme u příhody z úvodu. Zásluhou algoritmů, jež dokáží na základě nahraných pár vteřin rozdělit pohyb osob na normální či podezřelý, může „umělá inteligence“ předem upozornit na nebezpečí. „Naším cílem je videa rozdělit do tříd a rozlišit člověka normálního, opilého, postiženého, zraněného nebo někoho, kdo utíká. Možné jsou i doplňky: zda se třeba zastavil a cvaknul si jízdenku,“ vypráví Zemčík. Projekt šestého rámcového programu EU je koordinován francouzským konsorciem Thales, jež má zkušenosti jak ze zbrojařského, tak i telekomunikačního průmyslu. Automatická identifikace osob, jak ji známe kupříkladu z filmu Nepřítel státu, je ale složitá – záleží na rozlišovací schopnosti bezpečnostních kamer. Užití je zatím prozaičtější. V Itálii do metra nesmějí psi a kola, tudíž na ně má systém upozornit. Díky součinnosti se „zvukaři“ z FIT se ale může jednat i o vyhledávání složitějších úloh: například když se podivín klátí na okraji platformy a k tomu se ozývá zvuk přijíždějícího a brzdícího vlaku. To je přeci jen jiná situace, než když čáru na peronu překročí spěchající mladík.

bitcoin_skoleni

I-mapky s 3D otáčením

O zajímavé nápady nemají na katedře nouzi. Vyvíjejí tu dokonce i 3D mapy, které by měly uživateli přinést věrný obraz krajiny. Ať už jde o turistický resort v Alpách anebo mapu centra města. K zachycení plastické situace jsou zapotřebí četné údaje: satelitní snímky, vrstevnice, ale i pozemní fotky objektů. „Projekt musí být užitečný, a tedy veřejně přístupný z internetu. Uplatnění by mohl nalézt jednak v cestovním ruchu, ale i jako CAD vizualizace dopravních projektů a též ke sledování vytíženosti silnic,“ říká doktorand Jaroslav Přibyl, jenž jako dizertaci chystá 3D model fakulty FIT. Vzhledem k objemu přenášených dat se brněnští experti též věnují akceleraci zpracování obrazu v programovatelném hardwaru.
Značné možnosti přináší užití takzvané rozšířené neboli augmented reality (AR). Oč jde? Pomocí speciálních brýlí, jimiž je na horním snímku vyzbrojen Vítězslav Beran, lze do reálného obrazu vložit umělé objekty a rekonstruovat jejich polohu či tvar. „Představte si promítnutí CT nálezu, umístění nádoru anebo projekci cév při lékařském zákroku na sále. Využití je možné i v armádě,“ tvrdí Beran. Stačí popustit uzdu fantazii a v AR můžeme ovládat počítačové „ikonky“ v prostoru, ukazovat na virtuální „obrazovky“, které mohou dle účelu měnit tvar, vkládat informace či pokyny na zdi, tabule i čelní skla automobilů… A nemyslete si, že se jedná o prachsprosté sci-fi fantazírování ve schizofrenním stylu Philipa K. Dicka! Leckterá automobilka už má futuristické divize, v nichž bádají i nad tím, jak řidiče ochránit. Během jízdy jej snímá kamera. Palubní počítač výsledky vyhodnocuje a v případě, že ve tváři nalezne stopy hněvu či únavy, zpomalí. Nebo i zastaví, což se může hodit i v případě klimbajícího vlakvedoucího, který pádí k nástupišti s klátící se postavou.

BOX (+ tři pidifotky):
Na obrázky chytře Odborníci na takzvanou sumarizaci videa dokáží ze záznamu vybrat automaticky to nejpodstatnější, nejvýmluvnější a firemním archivářům nabídnout výstižný sestřih o pouhé tříprocentní délce (1). Do římského a turínského metra nesmějí psi ani jízdní kola. Úkolem pro počítačové grafiky je naučit kamerové systémy automatickou detekci těchto přestupků (2). Z typických grimas a výrazu ve tváři umějí počítače dokonce odhadnout lidské emoce, jak naznačuje doktorand Michal Hradiš (3).
Pramen: Graph@FIT, VUT Brno

  • Našli jste v článku chybu?