Společnost Carvago zabývající se prodejem ojetých vozů analyzuje každý den miliony automobilových inzerátů z celé Evropy. Kvůli obrovskému množství informací se přitom jedná o zdlouhavou a náročnou činnost. „Kdybychom znali u každého inzerovaného vozu jeho VIN kód, zjistili bychom všechny potřebné informace relativně snadno a spolehlivě. Jenže v celoevropském měřítku u devíti z deseti aut VIN chybí,“ vysvětluje ředitel datového týmu Carvago Tomáš Trnka.
Vzhledem k absenci zmíněného VIN kódu se tedy dosud veškeré informace musely třídit ručně, což vyžadovalo velký počet zaměstnanců: „Máme k dispozici sadu fotek, strukturované údaje jako nájezd, cenu, parametry motoru a podobně, a k tomu nějaký textový popis, často nepřesný, s překlepy a nejasnými formulacemi. Zpracovávat tato data v objemu, jaký každý den proteče našimi systémy, není v lidských silách.“
I proto navázala skupina EAG, jíž je Carvago součástí, spolupráci s odborníky z Laboratoře datových věd Univerzitního centra energeticky efektivních budov ČVUT, v rámci které byla vyvinuta umělá inteligence umožňující zpracovávat fotografie ojetých vozů hromadně. Program je schopný s bezkonkurenční rychlostí roztřídit desetitisíce obrázků podle toho, zda je na nich exteriér, či interiér. Ba co víc, rozpozná také značku i model auta, stejně jako to, v jakém úhlu je na fotografii natočené.
Určí cenu ojetiny s přesností na tři procenta
Přestože je společně vyvinutá technologie stále relativně nová, už nyní podle Trnky představuje významnou pomoc. „Můžeme automaticky řadit fotky tak, aby v každém inzerátu byly vždy ve stejném pořadí. Navíc zvládneme identifikovat rozmazané a neužitečné fotky, a dokonce umíme poznat kompozice, které se našim zákazníkům budou líbit nejvíce. Kdyby to měli dělat lidé, potřebovali bychom jich celou armádu,“ tvrdí ředitel datového týmu.
Asi největší praktický význam má však pro Carvago možnost určení ceny aut podle jejich typu, stáří a výbavy. Velký soubor inzerátů z celé Evropy pomohl odborníkům z ČVUT vytvořit algoritmus, který určí hodnotu konkrétního vozu s přesností okolo tří procent. U nejběžnějších značek je ale toto číslo ještě vyšší. „Díky tomu se naši experti mohou soustředit na skutečně problematické případy a nemusí ověřovat ceny běžných vozů,“ uvádí Trnka.
Dalším cílem je umělou inteligenci pochopit
Carvago nyní pracuje na zprovoznění již sedmé generace modelu strojového učení. Tato verze po úvodním nacenění vozu ještě zkontroluje fotky auta a cenu podle nich dodatečně zkoriguje. „Dlouho jsme se snažili natrénovat model tak, aby se ‚koukal‘ na určité věci. Nakonec jsme ale umělé inteligenci nechali volnou ruku a ona se sama naučila, co na fotkách sledovat, aby došlo ke zpřesnění odhadu. My pak až zpětně zjišťujeme, které prvky byly ty cenotvorné,“ doplňuje Trnka.
Současný výzkum se ale neomezuje pouze na zpracování fotografií. Umělá inteligence pomáhá analytikům společnosti Carvago získávat z nestrukturovaného textu inzerátů informace o výbavě, závažnějších opravách nebo o existenci servisní knížky. Do budoucna pak firma připravuje také strojové generování popisků inzerátů na základě vytěžených parametrů o autech.
Před výzkumníky ovšem stojí i mnohem větší výzvy. Jednou z nich je třeba takzvaná interpretovatelnost modelů, kdy se odborníci snaží různými metodami pochopit, které faktory umělá inteligence vyhodnocuje jako důležité pro rozhodování. Další snahou pak bude postupné zvyšování jistoty, s jakou tento nástroj určuje své závěry. „Úplně jinak budeme přistupovat k informaci, že by auto mělo stát 320 tisíc korun a model si je jistý na 95 procent, než ke stejnému nacenění s jistotou kolem 17 procent,“ uzavírá Trnka.