Komplexní pohled na kvalitu dat snižuje firmě náklady a zvyšuje její konkurenceschopnost
Významným tématem posledních let je kvalita dat a její dopad na výkonnost podniku. Co však kvalita dat je? Jak lze vyčíslit jí způsobené ztráty? Jak lze následky (ne)kvality dat řešit? Jak se dá změřit? Mohou být data kvalitní například na 80 procent? Co to pro podnik znamená?
Účel
Je možné si to vysvětlit například na vizitce – Karel Novák, Matouškova 10, Praha, mobilní telefon 602 222 333, která je uložená v některém z informačních systémů. Jak kvalitní je tato informace?
Záleží na tom, čemu má sloužit. Pokud pouze ke kontaktování pana Nováka, pak je pravděpodobně postačující. Pokud je třeba data dále automaticky zpracovávat – personalizovat dopis, tisknout obálky nebo vybrat zákazníky z nějaké oblasti – pak uvedená informace rozhodně není kvalitní. A při jejím použití lze očekávat, že svůj účel nesplní. Z toho vyplývá, že se definice kvality dat odvozuje od „požadavků“. Kvalita dat je tedy vyjádřením míry splnění účelu, na nějž mají být použita. Jak to lze změřit?
Stačí sepsat detailní požadavky na data. Kvůli lepší klasifikaci lze požadavky rozdělit do pěti kategorií. První je kompletnost – je k dispozici vše potřebné pro náš účel? Má adresa například poštovní směrovací číslo? Druhou kategorií je přesnost – odrážejí data skutečnost? Je možné to nějak ověřit? Je adresa uložena v systému? Třetí kategorií je aktuálnost – jak stará jsou data? Jsou ještě použitelná? Má zákazník stejný příjem jako před pěti lety? Čtvrtou je integrita – shoduje se počet zákazníků v první a druhé zprávě? Má zákazník typu „podnik“ přiřazené produkty určené pro podniky? A pátou kategorií je přístupnost – jakým způsobem a jak rychle se lze dostat k potřebným datům?
Data je pak třeba vyhodnotit na základě jednotlivých kritérií. A následně statisticky (například dle průměru) určit, na kolik vyhovují všem požadavkům. Výsledek je sice obtížně uchopitelný (co znamená 80 procent kvality?), dá se však použít k posouzení toho, zda se vyplatí investovat do aktivity, která na datech závisí. Případně ke sledování, jak si vedeme v úsilí jejich kvalitu zvýšit.
Cena za (ne)kvalitu dat
K (ne)kvalitě dat se vztahují jak náklady, tak cena nevyužitých příležitostí. Konkrétní dopady na ziskovost podniku značně souvisejí s typem a oborem jeho podnikání. Obecně je však nejviditelnější kvalita zákaznických dat. Pokud se tedy hovoří o kvalitě dat, většinou jsou myšlena zákaznická.
Ztráty vyplývající z nekvalitních dat mohou například spočívat ve špatných adresách zákazníků, což vede k nedoručeným zásilkám i k nákladům na dohledání správných. Pokud si podnik uvědomuje, že data nelze použít k marketingovým účelům, vznikají navíc obrovské ztráty z nevyužití příležitosti oslovit klienty, což snižuje tržby.
Špatné identifikační údaje zákazníků zase vedou k jejich uložení v několika systémech. A následně ke špatnému vyhodnocení hodnoty zákazníka. Důsledkem může být kupříkladu neposkytnutí půjčky bonitnímu zákazníkovi. Popřípadě oslovení zákazníka s nabídkou produktu, který už vlastní.
Špatně vyhodnocené transakce zákazníka mohou vést k neodhalení podvodného chování. Nekvalitní demografická data znemožní provést odpovídající segmentaci zákazníků a správně zacílit marketingovou kampaň. Náklady na marketing jsou proto zbytečně vysoké a v případě obecnější kampaně i špatně směrované. Po sečtení dopadů v jednotlivých oblastech jde o částky, které značně převyšují případné náklady na řešení kvality dat.
Řešení problémů
Při řešení kvality dat je třeba rozlišovat mezi jejich čištěním a kvalitou. Čištění je více technickou záležitostí. Předpokladem je, že se ví, co čistit, jak to má vypadat, kde to bude uloženo a kdo se o to postará. Kvalita dat je oproti tomu širším pojmem, který zahrnuje změny v současných systémech, procesech i organizaci. Oblasti, ve kterých se většinou kvalita dat řeší, definuje konkrétní rámec (viz Rámec pro komplexní řešení datové kvality). V této oblasti je důležité definovat role jednotlivých oddělení, jejich vztahy, odpovědnosti a procesy. Jednu z hlavních rolí hraje vlastník dat, který musí být z byznysu (nejde o informační technologie, IT). Jeho hlavní odpovědnost spočívá v definici požadavků dat, a tedy kvality. Každé oddělení může mít jiný názor, a proto je zde další důležitá role – „data steward“, který působí jako prostředník v byznysu i mezi ním a IT.
Sběr, hodnocení a integrace
Nejjednodušší a zároveň nejefektivnější je provádět kontrolu a čištění dat při jejich vstupu do podniku. Mezi hlavní zásady, které pomohou předcházet mnoha problémům, patří za prvé sběr jednoho typu dat, pokud možno jediným systémem. Ostatní systémy budou tato data pouze používat (například zdrojem pro zákazníky je systém řízení vztahu se zákazníkem – CRM). Za druhé, změna struktury dat na zdroji je často levnější než pozdější reformátování. Za třetí, motivovat zaměstnance nejen za účelem výkonu (například počet vložených faktur), ale i kvality. Za čtvrté, data je nejlepší hodnotit v reálnem čase. A pro kontrolu využít i externí číselníky.
Ve velkých podnicích existuje složitá infrastruktura s mnoha samostatnými jednoúčelovými aplikacemi. Problémem v tomto případě je zajištění synchronizace těchto „ostrovů dat“ – buď v reálném čase, nebo dávkově. Snaha o synchronizaci v reálném čase se považuje za samozřejmou. Kvůli velké složitosti se však v praxi spíše používá dávkové zpracování. Pak je však nutné věnovat pozornost procesům k řešení „kolizí“, které systém není schopen rozhodnout (nejasné spárování, odlišné hodnoty ze dvou různých systémů).
Ať jsou data jakákoli, lze je považovat za nekvalitní, pokud nejsou k dispozici včas a správným lidem. To se dnes zpravidla dosahuje technologiemi datových skladů. Často opomíjenou oblastí je však správná dokumentace dat, využití metadat a byznysového slovníku. Jen takto lze totiž zajistit, aby uživatel data nalezl a dokázal je i správně interpretovat.
Řízení a projekty
V poslední oblasti se definují procesy, které zvyšují nebo udržují kvalitu existujících dat v podniku. Lze uvažovat o iniciativách, jako jsou pravidelné audity dat, definování pravidel pro jejich obnovu – protože stárnou, je nutné v pravidelných intervalech provádět aktualizaci – nákup a integrace zdrojů třetích stran (různé číselníky, registry organizací). Do této oblasti spadá i úprava už jednou pořízených dat.
Při řešení kvality dat se podniky orientují především na jejich vyčištění – zejména na opravu struktury adresy a jména. Je však nutné si uvědomit, že ani správně naformátovaná adresa neznamená kvalitní data. A pokud manažer chce snížit náklady a zvýšit konkurenceschopnost podniku, musí se na kvalitu dat podívat komplexně.
Kvalitní data, která je firma navíc schopna efektivně používat, v sobě nesou potenciální konkurenční výhodu. A ta může znamenat poslední krůček, kterým je možné bodovat i na dnešních, vysoce konkurenčních trzích.
Box:
Rámec pro komplexní řešení datové kvality
Vlastnictví dat a jejich řízení
Strategie
Sponzoring
Organizace procesy
Pravidla a standardy
Indikátory výkonnosti
Sběr a vyhodnocení dat
Co sbírat
Vyhodnocení ve chvíli pořízení
Trénink a motivace
Integrace dat
Primární zdroj dat
Toky dat
Integrace v reálném čase versus dávková
Dodání a sdílení informací
Zprávové a analytické nástroje
Centrální uchování dat
Dokumentace
Řízení datové kvality
Vyhodnocení a čištění sběru dat
Monitoring a audit
Externí zdroje dat
Migrace dat
Souvislosti
Dopady (ne)kvality dat na ziskovost podniku souvisejí s typem a oborem jeho podnikání. Obecně je nejviditelnější kvalita zákaznických dat.
Pokud data nelze použít k marketingovým účelům, vznikají ztráty z nevyužití příležitosti oslovit klienty, což snižuje tržby.
Špatné identifikační údaje zákazníků vedou k jejich uložení v několika systémech.
Špatně vyhodnocené transakce zákazníka mohou vést k neodhalení podvodného chování.
Nekvalitní demografická data znemožní provést odpovídající segmentaci zákazníků a správně zacílit marketingovou kampaň.
Po sečtení dopadů v jednotlivých oblastech jde o částky, které značně převyšují případné náklady na řešení kvality dat.