Odemykáme potenciál AI & Machine Learning v e-commerce - řízení AI projektu (část 3)

Aktualizace: 5. pro 2019

Vítáme vás u třetího článku ze série článků o AI a Machine Learningu v e-commerce. V tomto díle si krátce rozebereme problematiku řízení projektů z oblasti umělé inteligence.

Tip: Je pro vás AI a Machine Learning novinkou? V tom případě doporučujeme první článek série o AI a Machine Learningu - základní pojmy :-)

Průběh AI projektu

CRISP-DM (Cross Industry Standard Process for Data Mining)

Pokud se v oblasti analytiky již pohybujete, možná vám něco říká projekt CRISP-DM (Cross Industry Standard Process for Data Mining). Nejedná se o žádnou novinku - jeho původ se datuje k roku 1996, kdy jej vedly firmy Integral Solutions Ltd (ISL), Teradata, Daimler AG, NCR Corporation a OHRA. Výstupem tohoto projektu je metodologie pro práci s daty, která je s drobnými úpravami a pod novými názvy používána dodnes ve výzkumných centrech technologických gigantů, jako je například IBM. Jde o soubor postupů, který se dá velice snadno překlopit i do oblasti umělé inteligence a strojového učení.

  • Vždy se vyplatí mít systém, který zajistí, že se na nic nezapomene, a který umožňuje snadnou orientaci v celém procesu.

Jak může vypadat průběh AI projektu? V pbi.ai používáme následující postup:

  1. Analytická fáze - formulace hypotéz ohledně driverů problému a potřebných zdrojů dat. Poté, co nashromáždíme data, validujeme business hypotézy a získáme postřehy z dat (insights). Následně určíme vhodnou strategii pro další postup.

  2. Fáze prototypování - po úvodní analýze následuje matematické modelování, při kterém probíhá výběr a optimalizace algoritmů využívaných při strojovém učení. Důležitou součástí této fáze je feature engineering - hledání a příprava proměnných z dat, které mají velkou informační hodnotu, a tím pádem vliv na přesnost a konzistenci matematických modelů.

  3. Produkční fáze - implementace prototypu vyvinutého v minulé fázi probíhá dle používané infrastrutury. V některých případech jde o ETL pipeliny, které během streamingu vytváří a aktualizují matematické modely v reálném čase, jindy jde o standalone modul, který spouští jednotlivé iterace strojového učení v intervalech podle dostupnosti nových dat.

Tip: Jaká data jsou vhodná pro umělou inteligenci a strojové učení? To se dozvíte v předchozím článku série o AI a Machine Learningu - jaká data používat.

Rozdíl mezi AI projektem a klasickým vývojem software


V rámci naší praxe se často setkáváme s přístupem, kdy je AI projekt řízen jako běžný SW projekt. To má však řadu úskalí - tím největším je metrika, podle které se měří postup.


Klasický vývoj SW se dá přirovnat ke stavbě domu - existuje jasný, předem daný cíl a přesně dané pořadí kroků, které budou následovat. Metrika je v tomto případě zřejmá - počet hotových funkčních prvků. Testování je také jasná věc - když zvládáte unit testy, nemělo by vás v produkci nic překvapit.



V případě data-driven projetů a AI jde však o iterativní výzkum, který se podobá hledání cesty v bludišti nebo skládání puzzle. Cíl se může měnit dle informací zjištěných z dat. Namísto funkčních prvků zde máme přesnost a konzistenci matematických modelů. Úspěšnost v produkčním prostředí je dána tím, do jaké míry se nám povedlo při prototypování nasimulovat reálné podmínky.


Při tvorbě plánu pro využití AI je tedy nutné počítat s větší mírou nejistoty, která je dána variabilitou dat a podmínek v reálném prostředí. V každém případě však získáme cenné postřehy z dat, které pomohou optimalizovat obchodní strategii.


Tip: za odměnu, že jste dočetli náš článek tak daleko, máte nárok na 5% slevu na workshop „Úvod do AI pro business, markeťáky a produkťáky" Při rezervaci stačí zadat slevový kód ai_2019


Jak vypadá AI projekt v praxi?


V předchozím článku série o AI a Machine Learningu - jaká data používat, jsme popisovali modelový příklad fiktivního e-shopu FiktivniEshop, který se rozhodl zvýšit kvalitu svých služeb prostřednictvím automatizované personalizace webu. Co se bude odehrávat v jednotlivých fázích projektu?


Analytická fáze


Jako první proběhne zamyšlení se nad samotným jádrem problému a tvorba ontologie - definice a popis vazeb, které v daném problému figurují.


V našem modelovém příkladu můžeme začít úvahou, jak by postupoval lidský expert (prodavač) u zákazníka v kamenné prodejně. Ten by pravděpodobně využil demografická data (pohlaví, věk, pravděpodobná sociální situace), dosavadní zkušenost s daným zákazníkem (historie transakcí), nákupní chování (prohlížené produkty) a aktuální kontextovou informaci (co se děje u konkurence, jaké je zrovna období a trendy).


Následuje analýza dostupných dat a tvorba datové strategie. Řekněme, že FiktivniEshop již shromažďuje transakční data, přičemž u registrovaných zákazníků má k dispozici jejich jméno na základě předchozí objednávky. Dále si udržuje roční historii detail views (rozkliknutí detailu produktu zákazníkem) a vložení zboží do košíku. Nějakou demografii, historii a nákupní chování máme - provedeme tedy korelační a shlukovou analýzu s cílem potvrdit hypotézu, že tato data skutečně obsahují to, co potřebujeme.

  • Získáme důležité informace z dat, které mohou kromě tvorby matematického modelu posloužit k optimalizaci celkové obchodní strategie.

Co však chybí je kontext - tedy informace o stavu trhu, konkurenci a trendech. Výstupem analytické fáze může být mimo jiné doporučení, jaké zdroje dat by bylo vhodné zajistit, například zda extrahovat klíčová slova z článků konkrétního influencera pro zjištění aktuálních trendů v dané oblasti.



Fáze prototypování


Na základě předchozí analýzy vybereme vhodné matematické modely a provedeme simulaci výstupů pomocí historických dat.

  • V oblasti umělé inteligence platí princip Occamovy břitvy - jednoduchý model a kvalitní data dávají vždy lepší výsledky než složitý model a nekvalitní data.

U e-shopu FiktivniEshop může jít o ručně vytvořená pravidla na bázi demografických informací, která doplníme o clustering na základě matice relevance mezi produkty výpočtené z transakčních dat (strojové učení bez učitele). Následně otestujeme, jaké výstupy model dává v konkrétních případech.

  • Doporučujeme vždy sledovat konzistenci modelu - právě ta určuje, do jaké míry se na konkrétní řešení můžeme spolehnout v reálném prostředí.

Pokud jsme s výsledkem spokojeni, můžeme přejít k produkční fázi. Pokud spokojeni nejsme, následuje feature engineering a optimalizace modelu - na základě analýzy vytvoříme z dat proměnné, které obsahují novou informaci, například z dosud nevyužitých zdrojů dat.


Produkční fáze


Výsledné AI řešení získáme integrací prototypu do existující infrastruktury.


V našem příkladě může jít o tvorbu API, které bude sloužit pro komunikaci mezi webovou stránkou a modelem, o naprogramování algoritmů pro přípravu vstupních dat, a o návrh databázového schématu pro uložení dosavadní podoby modelu.


  • Vhodným doplňkem je tvorba výstupů pro reporting a monitoring výsledků - tedy jak zákazníci reagují na personalizovaný obsah tvořený AI modelem v porovnání s obsahem tvořeným ručně.


Poté, co máme první výsledky z produkčního prostředí, určíme další postup. Vzhledem k čím dál větší dostupnosti dat se hodí jednou za čas prověřit, zda se neobjevila nová informace, která by mohla dosavadní řešení vylepšit.


Jak řídit AI projekt už vím - co dál?


V tom případě je navazující článek Odemykáme potenciál AI v e-commerce - jak sestavit AI tým (část 4) přesně pro vás! Sledujte náš web a sociální sítě :-).



Tip: Chcete načerpat inspiraci a zkušenosti od profesionála v oboru AI, ML a automatizace Ondry Kopičky? Přijďte na nový workshop "Úvod do AI pro business, markeťáky a produkťáky", který jsme pro vás připravili ve spolupráci s Powered by Insights.





©2019 Ecommerce-academy.cz, created with love by Milan, Marek & Ivča