Odemykáme potenciál AI & Machine Learning v e-commerce - otevíráme černou skříňku (část 5)

Aktualizace: 5. pro 2019


V minulých dílech naší série jsme představili témata, která řeší téměř každá firma, která experimentuje s pokročilou analytikou a umělou inteligencí - význam základních pojmů, základní procesy v rámci projektového řízení, jak uvažovat o zdrojích dat a sestavování týmu.


Nyní je čas se do problematiky ponořit o trochu hlouběji. Počet společností, které AI adaptovaly (nebo se o to alespoň snaží), stále vzrůstá, což koresponduje s obecným trendem posledních let;

  • Podíl investic do výzkumu a inovací ve firmách stále více převyšuje investice do reklamy, jak se o tom dočtete například v článku Harvard Business Review, který byl publikován v dubnu tohoto roku.

Spolu s tímto trendem vznikají i nové otazníky okolo využití AI, například

  1. vysvětlitelnost chování matematických modelů

  2. objektivita strojového učení

  3. umělá inteligence a etika

Pojďme rozebrat první z nich. Přejeme příjemné počtení :)


Tip: Je pro vás AI a Machine Learning novinkou? V tom případě doporučujeme první článek série o AI a Machine Learningu - základní pojmy :-)




Co se skrývá pod pokličkou AI modelu


Jak překlopit abstraktní informace do proměnných pro strojové učení jsme již krátce nakousli v druhém článku naší série. Na příkladu FiktivniEshop.cz jsme ilustrovali, jak lze uvažovat nad zdroji dat v případě personalizace obsahu imaginární online prodejny. Řekněme, že matematický model máme, ale rádi bychom lépe porozuměli procesům uvnitř. V tom případě záleží na typu modelu, který jsme se rozhodli použít.


Matice podobnosti a clustering metody


Inteligenci lze chápat jako nálepkování vstupních dat. Náš mozek každou milisekundu zpracovává vjemy (data) z několika smyslových ústrojí a přiřazuje jim kategorie a stavy na základě dosud získaných vědomostí. Jedná se v podstatě o hledání maxima pravděpodobnostní funkce. Pokud pro strojové učení využíváme asociační modely, můžeme tuto pravděpodobnostní funkci reprezentovat jako teplotní mapu nebo síťový graf.


Následující obrázek ukazuje, jak lze vizualizovat vnitřní strukturu jednoduché asociační matice. Primitivní strojové učení může vypadat následovně: pokud zákazník zakoupí produkt 1 zároveň s produktem 2, zvýší se hodnota pole na souřadnici [1, 2] (a symetricky [2,1]). Každý bod pak znázorňuje vzájemnou relevanci produktů na základě historických nákupů. Čím je hodnota vyšší, tím spíše zákazník, který vložil do košíku produkt 1, vloží do košíku i produkt 2, pokud mu jej nabídneme.


Nejvýhodnější kombinaci produktů k doporučení získáme tím, že nalezneme maxima pro daný řádek.


Teplotní mapa znázorňující relevanci mezi produkty

Mírně odlišnou reprezentaci získáme, pokud vztahy mezi produkty znázorníme jako graf. Každý bod grafu bude jeden produkt. Učení modelu si lze představit jako proces, při kterém se body posouvají k sobě podle prováděných nákupů. Časem vzniknou skupiny navzájem relevantních produktů (segmenty - clustery), které má smysl nabízet společně.


Vzájemná relevance produktů jako síťový graf


Random forest


Další princip, který v lidském rozhodování figuruje, je podvědomá tvorba stereotypů. Pokud si opakovaně projdeme stejnou situací se stejným výsledkem, pravděpodobnost daného sledu událostí překročí určitou hranici. Náš mozek si poté do budoucna podvědomě vytvoří pravidlo, které nahradí dosavadní výpočet pravděpodobnosti. Jde o jakousi úsporu výpočetního výkonu, který náš mozek může alokovat jinde.


Předsudky a stereotypy nám tedy pomáhají uvažovat rychleji a efektivněji. Ve světě strojového učení je zástupcem tohoto principu model typu random forest.


Random forest není nic jiného, než soustava několika IF-THEN rozhodovacích stromů. Důvtip tohoto modelu spočívá v postupu, kterým se tyto stromy a pravidla tvoří. Konečný výsledek závisí na nastavení parametrů pro strojové učení.


Důležité jsou především tyto:

  • počet rozhodovacích stromů v modelu

  • maximální hloubka jednotlivých stromů

  • počet datových bodů, které mohou vytvořit samostatnou větev

  • počet datových bodů, které mohou tvořit list stromu (tedy „koncový bod“ v každé větvi).


Při učení model na základě vstupních dat hledá proměnné a hodnoty, podle kterých lze data rozdělovat do jednotlivých větví stromu tak, aby byly splněny zvolené parametry.


Například u predikce budoucích nákupů si můžeme tento proces představit jako dělení zákazníků na segmenty podle toho, zda v minulosti provedli nebo neprovedli určitou akci nebo zda jejich dosavadní nákupy přesáhly v součtu určitou částku. Nároky na počty datových bodů v jednotlivých větvích a listech jsou v podstatě pravděpodobnostní limity, na základě kterých lze vytvořit nové pravidlo - stereotyp.


Limit na hloubku stromu se dá chápat jako maximální granularita, na kterou jsme ochotni „rozpitvat“ problém, který řešíme. Počet stromů v modelu pak odpovídá počtu variant řešení problému, které se po naučení modelu kombinují v konečný výstup.


Jeden z rozhodovacích stromů, které vznikly při učení modelu typu random forest pro predikci budoucího nákupu

Výsledky modelu tedy reprezentují vztahy mezi vstupními daty, přičemž vnitřní pravidla stromu odhalují klíčové proměnné a hodnoty, které tvoří dělící body. Random forest lze proto použít nejenom jako koncové řešení, ale také jako efektivní nástroj k obecnému porozumění datům v úvodní fázi prototypování. Z modelu lze vyextrahovat proměnné, kterým model při rozhodování přisuzuje velkou váhu. Dále získáme srozumitelná pravidla, která lze použít jako podklad pro strategické rozhodování.


Tip: za odměnu, že jste dočetli náš článek tak daleko, máte nárok na 5% slevu na workshop „Úvod do AI pro business, markeťáky a produkťáky". Při rezervaci stačí zadat slevový kód ai_2019


Neuronová síť


Matematický model neuronu

První model umělého neuronu sestavil v roce 1943 Warren McCulloch a Walter Pitts. Jednalo se o jednoduchou reprezentaci přenosu signálu mezi skutečnými neurony v lidském mozku. Přestože od té doby vznikly nové architektury neuronových sítí, základní princip je stále stejný. Na základě vjemů (dat) na vstupu dochází k postupné aktivaci jednotlivých neuronů skrze přenosovou funkci, jejíž parametry (váhy) se formují v procesu učení.



Neuronové sítě jsou často vnímány jako black box, jelikož nelze přesně vysvětlit, proč se při konkrétním vstupu aktivují právě tyto neurony. Do jisté míry se můžeme inspirovat biologií, potažmo neurovědou. Při výzkumu funkcí lidského mozku se sleduje aktivita konkrétních oblastí nervových center za konkrétní situace.


Stejně tak můžeme „logovat“, které skupiny neuronů v neuronové síti se aktivují při konkrétním vstupu, a tedy které „oblasti“ neuronové sítě jsou odpovědné za konkrétní rozhodnutí.


Otázka ale zní - může nám tato informace pomoci odhadnout, jak se neuronová síť zachová v budoucnu? Této problematice se současný výzkum stále věnuje. Pro příklad můžeme uvést studii Google AI, která se zaměřuje na interpretaci výsledků neuronové sítě při klasifikaci obrázků pomocí atribučního modelování. Jedná se o model, který „převádí“ důležitost jednotlivých pixelů obrázku na důležitost lidem srozumitelných příznaků, například jakou důležitost přisuzuje neuronová síť pruhům při klasifikaci obrázku zebry.


Co je uvnitř AI vím - jak postupovat dál?


Problematika vysvětlitelnosti složitějších AI modelů je aktuální téma mimo jiné i z etických důvodů. Čím dál častěji se otevírá diskuse o možné diskriminaci ze strany umělé inteligence a o tom, jak předejít zaujatosti matematického modelu. Pokud vás tato problematika zajímá, nenechte si ujít náš další článek :)




Tip: Chcete načerpat inspiraci a zkušenosti od profesionála v oboru AI, ML a automatizace Ondry Kopičky? Přijďte na školení „Úvod do AI pro business, markeťáky a produkťáky“, který jsme pro vás připravili ve spolupráci s Powered by Insights.


©2019 Ecommerce-academy.cz, created with love by Milan, Marek & Ivča