Hodnota dat spočívá v jejich využití. Otevřete je všem, doporučují experti konference Primetime for Big Data

Jak využívat data a jak je naplno zhodnotit? O tom diskutovali odborníci v rámci online konference Primetime for Big Data. Nechyběl mezi nimi ani klíčový řečník profesor Viktor Mayer-Schönberger z Oxfordské univerzity, který je považován za guru v problematice velkých dat.

Profesor Viktor Mayer-Schönberger zahájil osobně akci, která se s ohledem na nouzový stav uskutečnila online bez fyzické přítomnosti diváků. „Data nemají hodnotu samy o sobě, získávají ji jen, když je využíváte,“ řekl Viktor Mayer-Schönberger, který v Praze vystoupil poprvé. Realita je ale bohužel taková, že 85 % dat posbíraných v Evropě nikdo nikdy nevyužije. Starý kontinent tak ztrácí šanci získat mnoho nových pohledů na známé problémy. „Tím, že data nevyužíváme, přicházíme nejen o jejich hodnotu, ale také o inovace. Firmy, které to nechápou, jsou odsouzeny k zániku. Data jsou příležitostí, jak lépe porozumět světu,“ pokračovat Mayer-Schönberger.

Viktor Mayer-Schönberger je autorem základní práce o problematice velkých dat s názvem „Big Data. Revoluce, která změní způsob, jak žijeme, pracujeme a myslíme“ a řady dalších publikací.

Řešení vidí v radikálním otevření dat právě v evropském prostoru, což by nám pomohlo konkurovat digitálním platformám pocházejícím z USA a Číny. Jejich moc se projevila i v době pandemie, kdy na jejich schválení závisely aplikace sloužící k ochraně veřejného zdraví. Otevřenost považuje Viktor Mayer-Schönberger za součást nového pohledu na data („data mindset“), společně s jejich oportunistickým sběrem ve stylu „to se může někdy hodit“ a ochotou zkoušet nové věci bez jistého výsledku.

Nadchněte pro data kolegy, radí odborníci

Využití velkých dat ve velkých firmách bylo tématem hned několika vystoupení. Řečníci se shodují, že smysluplně pracovat s daty znamená především změnu způsobu uvažování jednotlivce a teprve potom hledání správných technologických postupů. „Data sama o sobě, která někde odpočívají, jsou úplně na nic. Je to jako písek, co musíme prosívat,“ potvrdil Jaroslav Rys ze Škoda Auto. K tomu, aby firma vnímala data jako strategický zdroj a ne jako nutné zlo, vede podle něj dlouhá cesta. Začíná identifikací a centralizací dat a následně analytickou prací s nimi pro konkrétní řešení. Stejný přístup k datům jako zdroji musí ale sdílet jak management, tak zaměstnanci. 

Předpokladem úspěchu jsou ale nejen přístupná a věrohodná data, ale také správné nástroje, které nás osvobodí od manuálního zpracování dat. Jaroslav Rys doporučil setřít ostrou hranici mezi IT a ostatními odděleními, např. controllingem. „Nyní jsme ve fázi integrace dat do centrálního úložiště. Učíme kolegy z jiných oddělení, např. HR, aby sami s daty pracovali a nemuseli s každým požadavkem chodit za IT,“ dodal Rys. V plánu je také kolegy z IT poslat na nějaký čas do dalších oddělení a naopak.

Michal Dúbravský z Plzeňského Prazdroje například zkoušel s kolegy hledat nové lokace pro hospody pomocí analýzy dat a také umisťovat na sudy senzory. Podobné projekty ale zatím nevyšly. Problém vidí Dúbravský jak v celkovém postoji firmy, tak v závislosti na třetích stranách jako zdrojích dat, ať už jsou to data ze sociálních sítí, nebo z digitální reklamy v době omezení cookies. Nyní chce mimo jiné s pomocí lepšího uchopení vlastních dat poznat českého spotřebitele, kde a jak často pije. To vše ale velmi podrobně podle hesla „nestačí vysílat zprávy do světa, musíte mu více naslouchat.“ Využije data z wifi v hospodách, vlastní aplikace, či správy skladů a pokladen. „Data musí sloužit jako vstupy, pak ale vždy musí přijít lidská kreativita a rozdělit je na to, co dává a nedává smysl. Nestačí jen zvyšovat efektivitu,“ dodal Dúbravský.

Velká data a umělá inteligence = předpoklad pro inovace ve vědě i v byznysu

Snazší situaci než výrobci rychloobrátkového zboží mají v přístupu k velkým datům banky, i když jsou vázány legislativou a bezpečností. Lukáš Mazánek z Raiffeisenbank potvrdil, že hlavním cílem banky je stát se „data centric“ organizací. Umělá inteligence jí pomáhá třeba odhalovat nevýhodné půjčky klientů u jiných finančních institucí. Přechod na big data vyžadoval novou platformu a tou se stal Hadoop, systém, který umí ukládat, zpracovat a od chyb očistit hodně dat. První úspěšné použití pomohlo také přesvědčit management banky, že další analýzy velkých dat mají přínos pro byznys. 

„Platformu se podařilo vybudovat za šest měsíců, začali jsme malým řešením, které se dalo v tomto čase zvládnout,“ potvrdil za dodavatele Marek Sušický z Profinitu. Řešení si z hlediska bezpečnosti vyžádalo i použití tzv. HSM zařízení s integrovanou pyrotechnikou. „U dat jsme používali chytrou anonymizaci, aby nebylo možné identifikovat klienta, který nedal souhlas s využitím jeho dat k marketingovým účelům,“ ubezpečil Sušický.

Ve spolupráci s firmou Intel Pavel Kordík z UNIQO.AI pracuje také na integraci globálních dat o jejích interních a externích expertech a jejich výsledcích. Řeší tím častou situaci, kdy jedno firemní oddělení neví, že jiné pracuje na stejném problému. Kordíkovou vizí je dát vědcům k dispozici asistenty v podobě umělé inteligence, kteří pro jejich objevy hledají příležitosti uplatnění v byznysu. A na druhé straně, inovační manažer ve firmě by mohl vyhledávat díky svému AI asistentovi nové talenty.

Jak využít efektivně data o výzkumu pro inovace, na to se zaměřil Pavel Kordík z UNICO.AI. Jeho cílem je zmenšit propast mezi akademickým a byznysovým světem a přiblížit je prostřednictvím chytrých dat a umělé inteligence. Jako globální řešení nabízí projekt experts.ai. Ten umožňuje najít díky patentovým databázím výzkumníky, kteří řeší aktuálně problémy, co vás zajímají. „Když například objevíme experta na technologii neuronového překladu, umíme najít byznysové uplatnění, třeba v automaticky generovaném obsahu v mediálních domech nebo pro popisky produktů v e-shopech,“ upřesnil Kordík. 

Data odhalí zdroj infekcí i nové zákazníky

Oblast, které lepší práce s daty může velmi pomoci, je zdravotnictví. O tom hovořil Jan Pešava z Hartmann-Rico. Jeho cílem je efektivnější a bezpečnější zdravotnictví a vybral si oblast neprávem opomíjených nozokomiálních infekcí (HAI), nemocí, které dostanete při pobytu v nemocnici. Postihnou až 4,1 milionů pacientů v Evropě (denně je jich přibližně 80 tisíc), celých 37 tisíc nemocných na ně ročně umírá. Českou republiku stojí roční léčba HAI až 10 miliard korun. Ze sta pacientů jich dostane tuto infekci sedm. 

Nemocnice vyhledávají data o těchto pacientech ručně, zcela tedy neefektivně, navíc každá nemocnice to dělá po svém. Hartmann-Rico nabídl hygienikům automatické zpracování dat z lékařských textů. Systém přitom musí z kontextu pochopit, co lékař textem myslel, a najít rovnou typ HAI infekcí – což umí lépe než při manuální práci. Největší výzvy vidí Pešava při integraci nemocničních informačních systémů. Z hlediska byznysu vidí přínos nejen v rovině CSR a poznání zákazníkům, tedy nemocnic.

Raphael Peschi z belgické pobočky společnosti Bisnode nabídl nový pohled na generování leadů kombinací on-line informací a AI. Jako příklad uvedl energetickou společnost orientující se na obnovitelné zdroje, která hledala nové zákazníky z řad dopravních společností. Úkolem bylo najít ty s velkým vozovým parkem, které jsou zároveň nakloněné ekologičtějším řešením. Bisnode se v tomto případě nespokojil se statickými daty, která nebývají často aktualizovaná a nemusí přesně reprezentovat současnou realitu. 

Proto se vyplatí tato data obohatit nestrukturovanými daty sesbíranými z online zdrojů. AI následně umožňuje vytvářet předpovědi poté, co se „vyučila“ na těchto datech získaných např. z textů, obrázků a odkazů na webových stránkách firem. Analýza obrázku pomůže zejména u mezinárodních projektů. AI rozebere obrázky na pixely a zkoumá v krocích kontrast, texturu, tvary a transformuje je na číselné vektory. Takto AI „přečte“ weby současných zákazníků a poté hledá obdobné obrázky na webu. Těmito postupy lze dosáhnout až 85% relevanci výsledků oproti tradičním 15% přesnosti.

Datoví žurnalisté z rozhlasu analyzovali techniku nejlepšího lezce světa

Konference přinesla i zajímavé ukázky ze světa datové žurnalistiky. Nela Krawiecová z Českého rozhlasu se podělila o vlastní cestu k příběhu, kdy s kolegy pomohla objasnit techniku nejlepšího lezce světa Adama Ondry. Zkusili ho ověsit senzory a sledovat ho při lezení technologií Motion Capture. Konkrétně sledovali pohyblivost kloubů, či tepovou a dechovou frekvenci, kamery na stěny. Zajímavým „nečekaným“ zjištěním bylo třeba to, že Adamovi při lezení tep klesal, a to až na 70 tepů za minutu. Bylo vidět, že ho lezení uklidňuje. A proč je Český rozhlas jedním z mála médií, která v Česku systematicky pracují s vizualizací dat? Je to oblast náročná na čas a finance, tedy dvě věci, kterých se českým médiím nedostává. Krawiecová také vyzvala účastníky konference k většímu sdílení dat.