Firmy dnes mají k dispozici ohromné množství různorodých dat, ale mnohé nedokážou toto bohatství využít tak, aby jim skutečně pomáhalo v růstu. Mnohdy totiž nemají jasně vytyčeno, kam mají v byznysu směřovat a čeho chtějí vlastně dosáhnout. „Proto je třeba si nejprve stanovit jasné cíle a teprve potom si za pomoci datové analytiky z té velké porce dat vytahovat relevantní informace, které firmu ke stanoveným cílům nasměrují,“ říká rozhovoru pro Technický týdeník Ota Novotný, vedoucí katedry informačních technologií FIS VŠE a prorektor pro rozvoj a Corporate Relations.
V praxi se pohybujete více než 20 let, změnila se za tu dobu práce s daty hodně?
V 90. letech se informační systémy plnily primárně „malými“ daty. Sledovalo se například skladové hospodářství, průběh výroby, objednávky a tok výroby. Například data ze senzorů strojů však k dispozici ještě nebyla.
Po roce 2000 se situace začala postupně měnit, nárůst objemu dat byl markantní zejména v průmyslu. Ale samozřejmě i v jiných oblastech se s postupnou digitalizací rozšiřoval objem získávaných a ukládaných informací. Výsledkem je, že máme čím dál více dat o tom, jak různé procesy probíhají. Vede to ovšem k tomu, že firmy najednou netuší, co s tou porcí informací vlastně dělat. Změřit totiž mohou všechno, nicméně bez přesně stanoveného cíle se v datech utopí.
Cest, které vedou k cíli, je navíc hodně a některé jsou dost trnité. Jak má firma najít tu správnou?
To je těžká otázka. Obecně vzato je podle mě třeba se vyvarovat toho, aby byla cesta k cíli tažená jen technologiemi. Tím myslím, že instantní metody nefungují. Pokud si firma myslí, že implementací technologie může okamžitě očekávat zisky, bude nejspíš zklamaná. Nástroj je totiž jen malou součástí toho, co se musí stát, aby zisky přišly a zákazníci byli spokojení. Konkrétní cíle by měl určit management, datová analytika pak může jeho rozhodnutí podpořit. Existují totiž také nástroje competitive intelligence [CI — konkurenční zpravodajství, jedna z disciplín business intelligence sloužící jako systém brzkého varování nebo podpory rozhodování — pozn. red.], což je legální skenování trhu a konkurence. Na základě takové analýzy si pak vedení musí stanovit svou vlastní cestu, nejlépe v několika variantách. To znamená, že musí mít i záložní plány. Ve chvíli, kdy toto klíčové rozhodnutí padne, se pak musí otočit a dívat se zpět, zda má pro cestu k cíli dostatečné datové zdroje a zda konkrétní lidé mají informace, které potřebuji vědět.
Datová analýza by tedy měla stát na začátku jako součást podpory rozhodování a pak by měla fungovat v průběhu jako podpora vytyčené cesty.
Jenže pokud firmy sbírají tak velké objemy dat, mohou se velmi snadno stát obětí informační obezity a cesta k cíli se rozpadá.
Máte pravdu. Jak začne člověk analyzovat, může se do dat zamotávat, protože je veden do čím dál větších a větších detailů provozu. Proto je potřeba umět od problematiky odstoupit a vybírat jen podstatné informace. K tomu jsou podle mě potřeba právě pravidelná zpětná kola reflexe, kdy se člověk musí dívat na to, co analyzuje, a vždycky si říkat, jak to přispívá k cíli, kterého je potřeba dosáhnout.
Naše studenty proto neučíme jen dělat grafy. Pracujeme s nimi na modelových byznysových zadáních a na řešení jim dáváme časový limit. Vědí tak, že pokud zabřednou do marginálií, úkol nestihnou splnit. V podstatě je nutíme k tomu, aby ořezávali věci, které nejsou důležité, a soustředili se na data, která jsou pro jejich cíl nezbytná: vedou například ke zvýšení zisku a porážce konkurence. A takto by mělo propojení cílů a datové analytiky fungovat také ve firmách.
Jak takové dovednosti ovšem naučit lidi, kteří se již v byznysu pohybují a nemají za sebou studium datové analytiky na VŠE či jinde?
Od roku 2019 pořádáme v rámci VŠE několikadenní workshop Datové minimum pro business, kterého se mohou účastnit nejenom naši studenti, ale také veřejnost, tedy lidé z firem. Je vhodný zejména pro zaměstnance z byznysových útvarů, aby pochopili princip a smysl datových analýz. Protože teprve když tyto znalosti mají, dokážou si říci, co potřebují za analýzy, a zvládnou je vztahovat k cíli, kterého je třeba dosáhnout.
Náš kurz je tak vlastně prvním krokem, který lidem ukáže, jak s daty pracovat. A pokud na to ve stejný moment ve firmě navážou oddělení, která jsou zodpovědná za data, může konečně začít fungující spolupráce mezi IT a byznysem. Ty dva světy už si začnou rozumět.
Máte pocit, že firmy stále ještě podceňují sílu svých dat, nebo jsou si vědomy toho, že mají v rukou poklad, i když třeba nevědí, co s ním?
Určitě si sílu dat uvědomují, ale neumějí s nimi nakládat. A má to spoustu důvodů. Jedním je informační přehlcení, což znamená, že firma má mnoho dat a nevyzná se v nich. Podstata problému je však podle mě v tomhle případě trochu jinde. Takový stav je totiž způsobený tím, že když se data začala sbírat, nikdo se neptal, co je jejich cílem. Druhým důvodem může být také strach z toho, že je datová analytika těžkou disciplínou. Přitom využívání výsledků tak složité není. Jen je třeba zlomit strach, pokročit od Excelu k něčemu dalšímu a uvěřit tomu, co někdo jiný spočítá. Čímž se dostávám ke třetímu velkému důvodu. Setkávám se s tím, že firmy nemají důvěru v návrhy byznysového rozhodnutí, které jim dodá počítač. Je to o výchově, o tom, aby se s problematikou lidé ve firmách nenásilnou formou seznámili, a hlavně aby jim to dokázal někdo správně vysvětlit. Pak to začne fungovat. Vysvětlit by jim to měl datový analytik. Co by tedy měl takový člověk všechno umět? Hodně lidí, kteří se věnují datové analytice, je nesmírně šikovných v práci s daty. Mají hardskills, dokážou počítat modely a v datech se vyznají. Naším úkolem ale je, aby se naučili, jak své schopnosti aplikovat v byznysu. A také je musíme naučit softskills, tedy aby o problematice dokázali hovořit.
Všeobecně bych řekl, že pro to, aby byl student v budoucnu špičkovým datovým analytikem, jsou potřeba tři věci. První je znalost analytiky a základů nástrojů a postupů, druhou znalost byznysu, tedy jak firma funguje, jaké má cíle a to, jak zapojit analytiku do chodu firmy, a třetí složkou jsou právě softskills.
I k tomu slouží například náš program MBA, kde máme už většinou seniorní pracovníky, a to jak z oblasti IT a analytiky, tak právě z managementu, kteří mají skvělé softskills a znalosti z byznysu, ale potřebují si doplnit odbornost. A jako velké pozitivum vnímám, že se tyto dvě skupiny, tedy analytici, kteří si potřebují doplnit byznys a softskills, a manažeři, kteří potřebují hardskills, potkají v jedné místnosti. Rychle totiž zjišťují, jak málo si rozumějí. A to je přínosné pro jejich další rozvoj.
Existují pro datovou analytiku mezinárodně uznávané standardy, podle nichž se pak při práci postupuje?
Máme standardy na kvalitu dat, ale podstatné metodiky jdou zatím mimo oblast těchto (ISO) norem. Nejdůležitějším dokumentem je v této oblasti v současnosti asi DMBoK (data management body of knowledge), což je takový manuál, jak datovou analytiku vůbec řídit. S tím totiž v současnosti firmy bojují nejvíce. Už není problém technologie nasadit, jsou dostupné a levné, ale je těžké celý ten analytický organismus uřídit dohromady. V jedné firmě může být mnohdy řada analytických technologií a spousta lidí, kteří se analýzami zabývají a stejně, jako se musí řídit výroba, je třeba vést i datovou analytiku. DMBoK ukazuje cestu, jak postupovat v oblasti, které se říká data governance. Najdete v něm ale i postupy, jak udělat organizační struktury, které analytiku řídí, a podobně.
Dokáže se větší firma v datech ještě zorientovat sama, nebo už jde o tak rozsáhlou problematiku, že je třeba pomoci specializovaných třetích stran?
Pomoc specializované firmy je většinou potřeba, ale na druhou stranu, toto je dovednost, kterou si firma musí dlouhodobě budovat a řídit u sebe. Externí firma může pomoci, ale na zkrocení dat je třeba interní člověk. Bez něj se nedá obejít.
Firma si tedy musí školit vlastní zaměstnance, a to nejlépe takové, kteří mají zkušenosti z byznysu, a třeba my, nebo kdokoliv jiný, jim dodá datovou a governance složku. Je to lepší než tyto vedoucí pozice zajišťovat outsourcovanými lidmi zvenčí.
A přesně o to jde právě v našem programu MBA. Chodí k nám zejména manažeři a dovídají se zde, jak analytiku celou uřídit.
Když se podíváme na analytické nástroje, kterých je na trhu opravdu mnoho, dají se nějak obecně kategorizovat podle toho, co dokážou?
Určitě ano, existují čtyři základní kategorie.
První skupina nástrojů se pouze dívá do historie, sbírá data o tom, co se ve firmě stalo, a to reportuje.
Nad nimi je skupina, která se dívá na to, proč se to stalo. To se z první skupiny nástrojů dá vyčíst pouze intuitivně. Tato druhá kategorie už umí pracovat s vícero daty a dokáže tak odpovědět na více otázek.
Třetí skupina je pak prediktivní. Umí odhadovat, jak by se situace mohla vyvíjet v budoucnosti. Pracuje s určitou mírou pravděpodobnosti, analyzuje časové řady a říká, co se asi stane, pokud budou podmínky i nadále stejné. V těchto nástrojích se objevují statistika i algoritmy umělé inteligence (UI).
A poslední skupinou jsou preskriptivní nástroje, které se zatím využívají jen někde, ne vždy ale přinášejí kýžený efekt. Tady algoritmy na základě predikcí přímo navrhují řešení, která by měla vést k cíli.
Co je tedy úlohou datového analytika, když vhodně zvolený software dokáže data analyzovat? Vytvořit predikci a navrhnout řešení?
V softwaru musí datový analytik nejdříve vytvořit model pro konkrétní účel predikce. Analytik tedy na základě existujících dat model učí, pak jej dá do provozu a musí sledovat, zda stále funguje a odhaduje správně. Modely jsou vytvořené na určité podmínky. Pokud se tyto podmínky změní, model nemusí fungovat správně.
Pokud bude mít například banka model na poskytování úvěrů a vstoupí na výrazně jiný trh, kde se obyvatelé chovají jinak, model může vykazovat nesprávné predikce či návrhy. V konečném důsledku to může znamenat, že třeba úvěr řadě lidí úplně zbytečně zamítne.
Analytik tedy nemá práci každodenní, ale v podobě přípravy mechanismu. Software sám nic nespočítá. Analytik musí model vymyslet, naplnit ho a kontrolovat, jak pracuje. A u preskriptivních nástrojů je analytikova práce ještě složitější, protože ho musí naučit dělat rozhodnutí. Model sám je nevymyslí, musí se je naučit na základě dostatku předchozích dat.
Tím se v podstatě dostáváme i do oblasti etiky strojového učení, že?
Přesně tak. Algoritmus se ze začátku učí z lidského rozhodování, tedy i na základě ovlivnění tím, kdo jej daty takzvaně nakrmil. Pak se může snadno stát, že například v případě již zmíněných úvěrů začne software odmítat určitou skupinu lidí. Z jedné strany je to naprosto relevantní, protože data říkají, že jsou z nějakého důvodu rizikoví, ale z té druhé mohou modely diskriminovat. Jenže se vlastně chovají přesně podle dat, která do nich jdou, proto jsou schopné leckdy převzít předsudky lidí, od kterých se učí. Což je samozřejmě riziko.
Existuje nějaká etická hranice toho, kam lze umělou inteligenci v těchto analytických nástrojích pustit?
Etickou hranici si nastavujeme sami. Je daná nejen legislativou, ale také pravidly společnosti a vnímání toho, co je ještě v pořádku a co není. To se liší i kulturně a do softwaru se zadat nedá. Etická hranice však může fungovat jako korekce toho, co software napočítá.
Momentálně probíhá o etice UI velká diskuse. Řeší se, jak by výrobci technologií měli garantovat, že jsou jejich algoritmy etické. Technologicky vše funguje, ale nyní se musí vyřešit tyto podstatné otázky, protože jak jsem říkal před chvilkou, stroje často interpretují to, jak se chováme my. Momentálně se na to připravuje legislativa v rámci EU a čeká nás velká celospolečenská diskuse na spoustě úrovní. Mimochodem, za Českou republiku etickou debatu na evropské úrovni moderuje SP ČR (Svaz průmyslu a dopravy ČR).
Na začátku jste zmínil oblast konkurenčního zpravodajství. Co všechno může firma pomocí datových analýz zjistit o své konkurenci?
Jde o obor, kde se lidé učí legálně získávat data o konkurenci z dostupných datových zdrojů a vědět tak o jejích záměrech. Firmy po sobě totiž nechávají velkou veřejnou datovou stopu, která se dá vysledovat a vytěžit.
Například oblast competit ive technical intelligence se zaměřuje na vytěžování informačních zdrojů, například patentových databází, zejména pro potřeby vývojových oddělení ve firmách. Jednou z úloh může být, že chcete vidět, kde se vaši konkurenti pohybují, na co se nyní zaměřují, a hlavně kam budou směřovat v budoucnu. Vymezíte si je, pak automaticky za pomoci těchto nástrojů prohledáváte patentové databáze a zjistíte, že si váš konkurent začíná budovat skupinu patentů kolem nějakého tématu. Takto je v podstatě možné odhalit jeho záměr a odhadnout, jakým směrem asi půjde.
Další oblastí, kde se dá competitive intelligence využít, je sledování úspěšnosti konkurentů ve veřejných zakázkách, ať už v mateřské zemi, nebo zahraničí. To je klíčové pro expanzi na cizí trhy, protože takto lze sledovat konkurenci i v tendrech na druhé straně světa. Pomáhá to zjistit, ve kterých zemích má firma ještě otevřené pole působnosti bez přítomnosti konkurence.
Když se člověk naučí dobře ptát, může dostávat každý týden svodku toho, co dělá konkurence v dané oblasti, co je nového, a to opravdu zcela legálně. A české firmy už si výhody tohoto typu datové analytiky pomalu začínají uvědomovat.
A vy osobně považujete konkurenční zpravodajství za etické?
Podle mě to etické je. Chci vědět, co dělá moje konkurence, zároveň ale nechci využívat nekalé praktiky. Jenom se dívám na to, co o sobě firmy samy zveřejňují. Sleduji jejich digitální stopu. Nic víc.
Každopádně masivnější nasazování competitive intelligence je důvodem, proč mnohé f irmy nechtějí patentovat. Nechtějí se objevovat v těchto veřejně dostupných zdrojích. Vědí, že té chvíli může informace o jejich práci kdokoliv vytěžit. Pokud ale v patentových databázích jsou, tak informace o svém vývoji dávají všanc ostatním. A ti toho mohou využít. Na druhou stranu je možné informace o jejich záměrech legálně vytěžit i jinak, z jiných zdrojů, takže jen nepatentování všechno nevyřeší.
Pokud bych měl ale takto profilovat konkrétního člověka, jeho činnost a záměry, tak už si etičností jistý nejsem ani trochu a mám s přijetím takových praktik potíž.