Výučba posilnenia môže dať marketingu pekné dynamické roztočenie

Obsah

Čo je to výučba posilnenia?
Žiadne chyby, žiadny stres - Váš sprievodca krok za krokom k vytvoreniu softvéru na zmenu života bez zničenia vášho života
Stroje pre obchodníkov
Už čoskoro
Myslenie väčšie
Cesta k osvojeniu

Zdroj: Juliatimchenko / Dreamstime.com

Zobrať:

Výučba posilnenia je podmnožinou umelej inteligencie a strojového učenia, ktoré môžu predvídať výsledky a pomáhať používateľom robiť lepšie rozhodnutia.

Obchodníci neustále hľadajú škálovateľné a inteligentné riešenia, keď sa snažia získať výhodu v čoraz konkurenčnejších marketingových podmienkach. Niet divu, že značky a ich marketingové organizácie teraz masovo prijímajú umelú inteligenciu (AI) a strojové učenie (ML). (Ak sa chcete dozvedieť viac o základoch ML, pozrite si Machine Learning 101.)

Pre nezasvätených sa AI môže všeobecne považovať za technológiu, keď počítač automatizuje definované úlohy, ktoré by človek inak vykonával. Strojové učenie, ako funkčná oblasť v rámci AI, je vtedy, keď má počítač konečný cieľ, ale sám si musí vypočítať najlepšiu trasu.

Dnes vidíme, ako sa tieto technológie - najmä strojové učenie - zavádzajú do mnohých oblastí marketingu vrátane zisťovania podvodov s reklamami, predpovedania správania spotrebiteľov, systémov odporúčaní, kreatívnej personalizácie a ďalších.

Aj keď je to všetko v poriadku, je tu nová technológia odnože, ktorá pre obchodníkov skutočne splní požiadavky, ktoré strojové učenie vytvára. Nazýva sa to „posilnenie výučby“ (RL).

Čo je to výučba posilnenia?

Krok-zmena z ML na RL je viac ako len list. Väčšina úloh odovzdaných strojovému vzdelávaniu zahŕňa použitie jediného kroku, napríklad „poznať tento obrázok“, „porozumieť obsahu knihy“ alebo „chytiť podvod“. Pre obchodníka je obchodným cieľom ako „prilákať, udržať a zapojiť používateľov“: v podstate viacstupňový a dlhodobý, ktorý sa nedá ľahko dosiahnuť strojovým učením.

Tu prichádza učenie o posilnení. Algoritmy RL sú o optimalizácii pre rozvíjajúcu sa a neustále sa meniacu cestu - cestu, kde sa vyskytujú dynamické problémy. Využitím matematickej „funkcie odmeňovania“ na výpočet výsledku každej permutácie môže RL vidieť do budúcnosti a urobiť správne volanie.

Najlepšie uskutočnenia tejto najmodernejšej technológie dnes možno vidieť v hrách a vozidlách s vlastným riadením. Keď systém AlphaGo spoločnosti Google minulý rok porazil najlepšieho hráča na svete v oblasti doskových hier Go, ich tajnou omáčkou bolo posilnenie vedomia. Zatiaľ čo hry stanovili pravidlá, možnosti hráča na ceste k víťazstvu sa dynamicky menia v závislosti od stavu hracej plochy. S učením zosilnenia systém zodpovedá za všetky možné permutácie, ktoré sa môžu meniť na základe každého nasledujúceho ťahu.

Podobne aj auto s vlastným riadením jede po ceste, v ktorej zostávajú pravidlá cesty a miesto určenia pevné, ale premenné na ceste - od chodcov po cestné bloky až po cyklistov - sa dynamicky menia. Preto organizácia OpenAI, založená spoločnosťou Tesla Elon Musk, používa pre svoje vozidlá pokročilé algoritmy RL.

Žiadne chyby, žiadny stres - Váš sprievodca krok za krokom k vytvoreniu softvéru na zmenu života bez zničenia vášho života

Svoje programovacie schopnosti si nemôžete vylepšiť, keď sa nikto nestará o kvalitu softvéru.

Stroje pre obchodníkov

Čo to znamená pre obchodníkov?

Kľúčové výzvy mnohých obchodníkov sú spôsobené skutočnosťou, že podmienky podnikania sa neustále menia. Víťazná stratégia kampane sa môže časom zhoršiť, zatiaľ čo stará stratégia môže získať nový ťah. RL je krokom k napodobňovaniu skutočnej ľudskej inteligencie, kde sa učíme z úspechu a / alebo neúspechu viacerých výsledkov a tvoria víťaznú stratégiu budúcnosti. Dovoľte mi uviesť niekoľko príkladov:

1. Vylepšenie zapojenia používateľa

Zamerajme sa na angažovanosť zákazníkov v reštauračnom reťazci a na cieľ ich znásobenia v nasledujúcom roku desaťnásobne. V súčasnosti môže marketingová kampaň zahŕňať narodeninové pozdravy so zľavou, možno aj na základe preferencií jedla. Toto je lineárne myslenie, kde obchodník definoval počiatočný a konečný bod.

V rušnom svete sa životy zákazníkov v reálnom čase neustále menia - niekedy sú viac angažovaní, niekedy menej. V rámci posilňovacieho učenia by sa systém neustále prekalibroval, ktorá taktika marketingovej zbrojnice má v ktoromkoľvek danom okamihu najlepšiu šancu posunúť príjemcu smerom k konečnému cieľu 10x angažovanosti.

2. Dynamické prideľovanie rozpočtu

Teraz si predstavte reklamný scenár, v ktorom máte rozpočet vo výške 1 milión dolárov a je potrebné, aby ste každý deň strávili každý deň až do konca mesiaca, rozdelený do štyroch rôznych kanálov: televízia, vernostné akcie a Google. Ako môžete zaistiť, že rozpočet utratíte optimálnym spôsobom? Odpoveď závisí od dňa, cieľových používateľov, ceny zásob a mnohých ďalších faktorov.

Pri učení zosilnenia by algoritmy používali historické údaje o výsledkoch reklamy na písanie funkcií odmeňovania, ktoré hodnotia určité rozhodnutia o výdavkoch. Zodpovedá však aj za faktory v reálnom čase, ako je tvorba cien a pravdepodobnosť pozitívneho prijatia od cieľového člena publika. Prostredníctvom opakovaného učenia by sa rozdelenie výdavkov na reklamu počas mesiaca dynamicky zmenilo. Aj keď je stanovený konečný cieľ, RL bude mať alokovaný rozpočet najlepším možným spôsobom vo všetkých scenároch. (Viac informácií o AI v marketingu nájdete v téme Ako umelá inteligencia spôsobí revolúciu v predajnom priemysle.)

Už čoskoro

Výučba posilnenia potvrdzuje komplexnosť a uznáva, že ľudia sú rôznorodí a zodpovedajú za tieto pravdy, čím sa zlepšuje každá ďalšia akcia v priebehu času, keď sa okolo nej menia kúsky vašej hernej rady.

Výučba posilnenia je stále do veľkej miery predmetom výskumných projektov a špičkových osvojiteľov. Matematická koncepcia a technika existuje už vyše 40 rokov, ale nasadenie nebolo možné až donedávna relatívne vďaka trom trendom:

Šírenie výpočtového výkonu prostredníctvom výkonných jednotiek grafického spracovania (GPU).
Cloud computing poskytuje špičkový procesorový výkon za zlomok ceny nákupu samotných GPU, čo umožňuje tretím stranám, aby si prenajali GPU na zaškolenie svojho modelu RL na niekoľko hodín, dní alebo týždňov za relatívne nízku cenu.
Vylepšenie v numerických algoritmoch alebo inteligentnej heuristike. Niekoľko kritických numerických krokov v algoritme RL je teraz schopných konvergovať oveľa rýchlejšie. Bez týchto magických numerických trikov by stále neboli uskutočniteľné, dokonca ani pri dnešných najvýkonnejších počítačoch.

Myslenie väčšie

To všetko znamená, že značky a obchodníci budú čoskoro k dispozícii nové právomoci v oblasti posilňovacieho vzdelávania. Jeho prijatie si však vyžaduje posun v myslení. Pre marketingového manažéra táto technológia znamená schopnosť zložiť ruky z volantu.

Každý podnik má svoj cieľ, ale keď ste hlboko v zákopoch, môžu byť každodenné činnosti smerujúce k tomuto cieľu nejasné. Technológia RL teraz umožní subjektom s rozhodovacou právomocou stanoviť cieľ a mať väčšiu dôveru v to, že systémy k tomu určia svoj najlepší smer.

Napríklad v dnešnej reklame si mnohí ľudia uvedomujú, že metriky, ako je miera prekliknutia (MP), sú iba proxy pre skutočné obchodné výsledky, počítajú sa iba preto, že sú spočítateľné. RL-riadené marketingové systémy de-zdôrazňujú takéto medzikontinentálne metriky a všetky ťažké zdvíhanie, ktoré je s nimi spojené, čo umožní šéfom zamerať sa na ciele.

To si bude vyžadovať, aby podniky premýšľali o svojich veľkých problémoch oveľa aktívnejším a dlhodobejším spôsobom. Keď bude táto technológia vyspelá, dosiahne svoj cieľ.

Cesta k osvojeniu

Výučba zosilnenia ešte nie je pripravená na úplné používanie značkami; obchodníci by si však mali vziať čas na to, aby pochopili tento nový koncept, ktorý by mohol spôsobiť revolúciu v spôsobe marketingu značiek, čím by sa naplnili niektoré z prvých prísľubov strojového učenia.

Keď príde napájanie, príde na trh softvér s používateľským rozhraním, ale úlohy, ktoré tento softvér vyžaduje, sa radikálne zjednodušia. Pre zamestnancov bude k dispozícii menej pohyblivých prepínačov a vstupných čísel, ako aj menej čítanie analytických správ a konanie podľa nich. Za prístrojovou doskou bude algoritmus väčšinou pracovať.

Je nepravdepodobné, že by RL zodpovedala ľudskej inteligencii hneď od brány. Rýchlosť jeho vývoja bude závisieť od spätnej väzby a návrhov od obchodníkov. Musíme zabezpečiť, aby sme požiadali počítač, aby vyriešil správny problém a penalizoval ho, ak sa tak nestane. Znie to, ako by ste učili svoje vlastné dieťa, však?