Lidé jsou upřímnější k robotům než k lidským operátorům, říká Michal Hrabí (Phonexia)

Voiceboti, neuronové sítě, umělá inteligence, ověření identity člověka pomocí jeho hlasu. Témata tak trochu z budoucnosti, ale pro Michala Hrabího z brněnské firmy Phonexia jsou denním chlebem. Vývojáři z týmu tohoto vizionáře patří ve světě hlasové identifikace mezi absolutní špičku, on sám naše perspektivy označuje za voice-first future.   

Jen tři vteřiny stačí k ověření identity člověka pomocí jeho hlasu. A hlas o člověku prozradí mnohé. Je něco jako otisk prstu, natolik unikátní, že se nedá napodobit. “Můžete ho měnit, snažit se zastřít, hrát si s jazykovými mutacemi, ale umělou inteligenci nepřelstíte. Naši voiceboti a další produkty, které umí ověřit identitu člověka, pracují s neuronovými sítěmi,” říká v rozhovoru pro Digibiz CEO Phonexia Michal Hrabí.

Neuronové sítě jsou umělý model biologických struktur neuronů v živých organismech, který je schopen se učit. Využívají se například v umělé inteligenci.

“Neříkám, že jsme v oblasti řečových technologií úplně jediní na světě, kteří tyto sítě využívají. Ale jsme v tom nejlepší. A zdokonalujeme neustále to, co jsme předtím sami vymysleli.” Michal Hrabí

Obor, ve kterém působíte, je hodně specifický…

MH: Jsme firma původem z Vysokého učení technického z Brna, která se zabývá technologiemi na zpracování řeči tak, aby byly uchopitelné pro další strojové zpracování. Potvrzujeme identitu mluvčího pomocí hlasu, což zajišťuje vyšší bezpečnost komunikačního kanálu. Navíc je díky tomu možné automatizovat rozhovor člověka například se strojem či robotem.

Pomáháme tomu, čemu já říkám voice-first future, čili budoucnost, ve které spolu lidé budou vzdáleně komunikovat raději videohovory, než že by si psali e-maily nebo posílali dopisy. Budeme spolu daleko víc v kontaktu pomocí hlasu a obrazu. A takhle budou lidé komunikovat i s úřady, firmami nebo například se stroji. A na to je právě potřeba umět uchopit lidský hlas a umět ho zpracovat.

Koronavirus urychluje digitalizaci společnosti

Nenahrává tomu současná situace ve světě?

MH: Celý svět je donucen velmi rychle přeskočit do digitálního světa. A to i firmy, které to zatím odmítaly, nebo v tom byly pomalé. Čili to, co by se asi za jiné situace dělo roky, se nyní transformuje během pár týdnů. Hodně lidí bylo nyní donuceno osahat si nástroje pro vzdálenou spolupráci, ať už je to sdílení dokumentů, podpisy smluv na dálku, interakce s dalšími členy týmu přes nějakou videokonferenci a podobně. 

To může být i dvojsečné…

MH: Je třeba zmínit, že s pokrokem se ruku v ruce zvýší také míra digitální kriminality. Lidé budou řešit více věcí digitálně než fyzicky, ale ne všechny komunikační nástroje budou dostatečně zabezpečené. Čili každá věc má dvě mince. Sice jsme díky digitalizaci schopni vyřešit některé věci daleko rychleji, zároveň jsme ale v ohrožení, že nám mohou být pod rukama odcizena data či přetvářeny dokumenty, což je možná ještě daleko horší. Vy mi třeba pošlete nějaký pokyn a někde po cestě bude změněn, například číslo účtu, kam se mají poslat peníze. 

Jak to tedy zabezpečit?

MH: A právě tady naše firma působí jako ochranný štít. Máme s tím dlouholetou zkušenost, například v podpoře vyšetřování zločinu. Kriminalistické ústavy v Čechách, Německu, ale i v Singapuru používají naše technologie při prokazování viny u soudu i při samotném vyšetřování. Je to docela důležitý nástroj k rozkrývání celých organizovaných skupin. 

Můžete uvést konkrétní případ?

MH: V Německu získala skupina zločinců informace o klientech banky. Jejich rodná čísla, bydliště a tak dále. A vybrali si jenom seniory. Pak volali do finančních institucí a měnili si hlas. Operátora linky přesvědčili, aby jim dal přístup k účtu. Šlo o několik set bankovních účtů, ke kterým se tato skupina dostala. Naše technologie k identifikaci osob pak pomáhaly klastrovat, který ten podezřelý udělal který ten telefonát podle nahrávek. Nakonec se i díky našim technologiím a práci fonetických specialistů podařilo zjistit, že trestných činů bylo daleko více, než si vyšetřovatelé původně mysleli.

Pomocí hlasu lze ověřit identitu člověka už během tří vteřin.

Lidé jsou upřímnější k robotům než ke klasickým operátorům

Kromě spolupráce s vyšetřovacími týmy míříte i do komerčního sektoru?

MH: O vládním segmentu už jsem mluvil, to jsou třeba kriminalistické ústavy, například německý Spolkový kriminální úřad Bundeskriminalamt. Komerční segment je ale podle mě určitě zajímavější. Věnujeme se například řešení na automatizaci call center. Máme k tomu voice bota neboli hlasového robota, se kterým člověk komunikuje pro odbavení určitých záležitostí. Jde například o zjišťování spokojenosti s kvalitou služeb. Zdá se, že lidé jsou upřímnější k robotu než k lidským operátorům. To je dáno asi tím, že jim před strojem není nepříjemné vyslovit negativní názor. 

Stejné technologie využíváme také pro analytiku na kontaktních centrech. Když například zavoláte do T-Mobile, O2, Invie, innogy nebo Home Creditu, tak u těchto společností se naše technologie využívají pro analytiku toho, kvůli čemu lidé na tu linku volali, a pro zkvalitnění dalších služeb zákazníkům. Tvoří se z toho reporty na management call center, zjišťuje se, zda operátoři svou práci dělají správně, zda nebyli například sprostí na zákazníky. Například typicky potřebujete odhalit naštvané zákazníky a mít možnost ovlivnit, aby tento zákazník nezpůsobil v budoucnu újmu vaší značce. A to třeba tím, že o ní bude špatně hovořit, protože naštvaný zákazník si to pro sebe nikdy nenechá. 

Čili pomáháte operátorům udělat z naštvaného zákazníka spokojeného klienta…

MH: Ano. A pak máme druhý produkt pro komerční zákazníky, a sice Voice Verify. To je nástroj, který umožňuje ověřit identitu mluvčího během tří vteřin jeho řeči. A to díky využití neuronových sítí. Já jako agent na call centru můžu velmi rychle zjistit, jestli jste ten, za koho se vydáváte. Zkrátka, zda skutečně hovořím s vámi. To opět souvisí s rostoucí mírou fraudu. 

Nedávno jsme to řešili s vyšetřovateli z Jižní Korey, kde zneužití telefonního kanálu pro přístup k interním informací vytvořilo jen v loňském roce škodu přes jednu miliardu dolarů. Policie tam vyšetřuje zločiny, kdy někdo někam volal a jeho totožnost se ověřovala pouze podle tradičního knowledge base verification, tedy typu rodné číslo, číslo smlouvy, jméno matky za svobodna. Ale vzhledem k tomu, že si na internetu můžete tyto informace od hackerů nakoupit, poměrně snadno otázky tohoto typu překonáte. 

A dostanete se přes telebanking až k financím… 

MH: To je samozřejmě velký problém. V současné chvíli se z telefonního kanálu stává úzké bezpečnostní místo, ale zároveň je to zcela nezbytný kanál pro interakci se zákazníky. Zvlášť teď, kdy spolu lidé potřebují řešit věci na dálku. S naším produktem už nemusíte ty klasické knowledge base verifikační otázky dělat. Nemusíte klientovi klást spoustu stupidních otázek. Už s nimi rovnou můžete řešit jejich problém, protože během chvilky víte, že hovoříte přesně s tou správnou osobou.

Jak ověříte, když si jen voláme, že jsem to opravdu já? Voice Verify to umí, a to tak, aniž by to mluvčího jakkoli obtěžovalo. Což třeba bankám a jiným institucím pomáhá zvyšovat user experience.

Tři vteřiny a je jasné, kdo je kdo

Jak to funguje v praxi?

Nejdřív potřebujete otisk hlasu, my tomu říkáme voice print. Je to referenční enrollment, u kterého víte, že to je ten člověk. Dělá se to pomocí předchozí nahrávky nebo se nahraje nová prostřednictvím robota. Potřebujeme k tomu cca dvacet vteřin hlasu. Technologie funguje nezávisle na jazyku. Takže když budete volat příště třeba v čínštině nebo angličtině, Voice Verify vás ověří i tak. Pro call centra to má velkou výhodu, protože se zkracuje doba, po kterou se zákazníkem hovoří. Zákazník je tak daleko méně obtěžován, je odbaven rychleji a pohodlněji.

Voice Verify funguje standardně v bankách a pojišťovnách. Tedy tam, kde se manipuluje s penězi. Phonexia ale má i poptávky od velkých firem ze zahraničí, s mnoha tisíci zaměstnanci. Často se jim stává, že se k informacím z firmy snaží někdo dostat tím způsobem, že postupně nabaluje informace. “Například – na recepci firmy zavolá člověk a tvrdí, že je květinářka, kterou si objednali na vánoční večírek. Chce znát místo a datum večírku, protože říká, že toho mají moc, a dostane se k prvním informacím. Pak volá a vydává se za někoho jiného, ale už s tím, že tehdy a tehdy je večírek tam a tam, postupně tak buduje znalost o celé firmě. Až se nakonec dostane k někomu, kdo mu to komplet zbaští. Může se vydávat za manažera, volat na finanční oddělení a přesvědčivě s nimi řešit tok peněz,” upozorňuje Michal Hrabí z Phonexie. Přes social engineering nebo social hacking můžou útočníci připravit firmu podle PricewaterhouseCoopers až o stovky milionů dolarů. A právě v těchto firmách může Voice Verify účinně pomoci.

Nejlepší z nejlepších pochází z brněnského VUT

Jak velký máte tým?

MH: Firma jako taková má kolem 60 lidí, z toho pracuje přibližně dvacet osob ve vývoji. Navíc hodně spolupracujeme s Vysokým učením technickým, s Fakultou informačních technologií, s tamní řečovou skupinou BUT Speech@FIT, což je vlastně jedna z nejlepších výzkumných skupin na světě. Na univerzitě je dalších třicet výzkumníků, kteří posouvají hranice možného v oblasti zpracování řeči. A náš tým a ten univerzitní spolu úzce spolupracují. 

Phonexia v plném nasazení.

Jak jste se do firmy dostal vy osobně?

MH: Do firmy jsem se přidal později. Nebyl jsem u jejího založení před 14 lety. Dlouhou dobu fungovala jen jako jakási obálka na občasné komerční aktivity výzkumníků, kteří po víkendech a po večerech dělali různé projekty a platili licence univerzitě VUT v Brně.

Michal Hrabí (39) je ve firmě už šest let. Dříve pracoval řadu let pro JIC (Jihomoravské informační centrum). To je organizace, která podporuje rozvoj podnikání zejména v Jihomoravském kraji a nejen tam. “JIC v tomto ohledu patří mezi absolutní evropskou špičku. Měl jsem tehdy na starosti aktivity pro startupy, troufám si říct, že jsem byl jedním ze strůjců startup ekosystému v Brně. Založil jsem první středoevropský startup akcelerátor, vzešlo z toho několik zajímavých firem, například i Kiwi. V JICu jsem měl  na starosti kompletní tvorbu programů na podporu podnikání. V té době byla Phonexia klientem JICu a čerpala jeho služby pro konzultace k byznysu. Když jsem se pak rozhodoval, co dál, tak mě oslovila právě Phonexia. Mně se moc líbilo, že tato firma dělá věci, které jen tak někdo nedělá, viděl jsem v tom obrovský potenciál,” vysvětluje Michal Hrabí.

Dokážete při zpětném poohlédnutí uvést významné milníky příběhu firmy Phonexia?

MH: V roce 2004 se výzkumníci z VUT účastnili mezinárodní soutěže, kterou pořádá americký NIST (National Institute of Standards and Technology). Je to taková technologická olympiáda. Účastní se jí nejlepší týmy světa, mají konkrétní úkol, který musí splnit. Tehdy v tom roce 2004 byli výzkumníci z Brna nejlepší na světě a vyhráli. A další rok znova. 

Publikovaly se o tom články v lokálních médiích a přišel zástupce zákazníka z vládního segmentu. Měl o náš produkt zájem. Jenže on to v té době ještě žádný produkt nebyl, byla to laboratorní soutěž, kde vytváříte nějaké nestabilní řešení. Nelze ho hned nasadit u zákazníka, natož ho servisovat a dál rozvíjet. Protože ale univerzita kvalitu nemohla garantovat, domluvilo se založení firmy a licenční smlouva vůči univerzitě. Výzkumníci produkt dotvořili do stavu, v jakém bylo možné to zákazníkovi nabídnout a prodat. 

A pak už se to rozjelo? 

MH: Firma byla strašně opatrná. Byl to tým akademiků, brali to zpočátku jako přivýdělek. Významný milník přišel, když se firma odvážila najmout první zaměstnance, protože poptávka rostla. Někteří akademici pak z univerzity úplně odešli, aby se mohli firmě věnovat naplno. 

Jak to vypadá ve Phonexii nyní?

MH: Loňský rok pro nás byl zlomový, měli jsme obrat kolem 50 milionů korun. Začali jsme se výrazněji zaměřovat na komerční sektor. Trh už je připravený a řada manažerů je edukována ve využívání řečové technologie. Velkou část nových zákazníků přinášejí naše účasti na odborných veletrzích a konferencích. Jezdíme na několik desítek akcí ročně po celém světě, od Austrálie přes Kuala Lumpur, Blízký Východ, až po kompletně celou Ameriku. Ale na druhou stranu v komunitě lidí, kteří něco o podobných technologiích vědí, jsme už známí. Speciálně v oblasti hlasové biometrie se o nás ví, že patříme mezi absolutní světovou špičku.