Menu Zavřít

Velký datový striptýz

29. 5. 2020
Autor: Mladá fronta

Sbíráme o vás hodně dat, ale nebojte, vše je anonymní. Zaklínadlo v podobě anonymních dat se opět hlásí o slovo, tentokrát vítr vane od karetní společnosti Mastercard, která zpřístupnila zdarma svou rozsáhlou databázi Mastercard Tourism Insights.

Kromě informací z karet jsou v této databázi i data, která Mastercard
nakoupila od třetích stran, jako jsou vyhledávače, rezervační systémy nebo
sociální sítě. Ale prý jde o agregovaná, vyčištěná, anonymizovaná a kdo ví jaká
ještě data.

Před dvěma lety publikoval The Guardian článek o tom, jak
odhaleny tajné základny speciálních jednotek
v zemích třetího světa. Vojáci
tam totiž chodili ven běhat s chytrými hodinkami. Data z těchto hodinek byla
také agregovaná a anonymizovaná, jenže v širokém okolí nikdo jiný s
healthtrackery nebyl, takže jakmile byla vystavena veřejně, bylo snadné je
odhalit.

Nedávno mi kolega poslal článek o tom, že ve státě Washington je legální
prodávat anonymizovaná zdravotní data a že jedna datová analytička dokázala
tyto záznamy propojit s fyzickou identitou několika lidí. Porovnala získaná
data s jinými dostupnými údaji, třeba z veřejně dostupných zdrojů, jako jsou novinové
články či sociální sítě. To je zase nějaký konspirační nesmysl, říkám si.

Jenže co třeba agregovaná data o pohybu z mobilních telefonů? Máte mapu a na ní čáry z mobilů. Jistěže anonymních. Co když je uvidí váš zaměstnavatel, co nemá příliš rád demonstrace. A uvidí tam trasu váš domov, zaměstnání a demoška? Dostanete padáka? Pokud se na zmíněné trase nepřipletlo moc telefonů, jste odhaleni. Čím méně datových stop spolu s kratším obdobím, tím spíše k odhalení dojde. Inu, není anonymizace jako anonymizace.

Řada subjektů dnes bezelstně vydává citlivá data v anonymizované podobě
jiným subjektům. Jak ale prohlásil jeden špičkový markeťák, skutečně
anonymizovaná data dneska nikdo nechce, protože se podle nich nedá profilovat.

MM25_AI

Tesat.

  • Našli jste v článku chybu?