Prehliadka modelov hlbokého učenia

Obsah

Neurálny štýl
Neurálny rozprávač
údaje
Char-RNN TED
záver

Zdroj: Kran77 / Dreamstime.com

Zobrať:

Hlboké vzdelávacie modely učia počítače myslieť samy od seba, s niektorými veľmi zábavnými a zaujímavými výsledkami.

Hlboké vzdelávanie sa uplatňuje vo stále väčšom počte oblastí a odvetví. Od áut bez vodičov, cez hranie Go, až po generovanie hudby z obrázkov, každý deň prichádzajú nové modely hlbokého učenia. Tu uvádzame niekoľko populárnych modelov hlbokého vzdelávania. Vedci a vývojári berú tieto modely a upravujú ich novými a tvorivými spôsobmi. Dúfame, že vás táto ukážka môže inšpirovať, aby ste videli, čo je možné. (Ak sa chcete dozvedieť viac o pokrokoch v umelej inteligencii, prečítajte si článok Počítače budú schopné napodobniť ľudský mozog?)

Neurálny štýl

Svoje programovacie schopnosti si nemôžete vylepšiť, keď sa nikto nestará o kvalitu softvéru.

Neurálny rozprávač

Neural Storyteller je model, ktorý, keď dostane obraz, môže vygenerovať romantický príbeh o obrázku. Je to zábavná hračka a napriek tomu si dokážete predstaviť budúcnosť a vidieť smer, ktorým sa všetky tieto modely umelej inteligencie pohybujú.

Vyššie uvedená funkcia je operácia „zmeny štýlu“, ktorá umožňuje modelu preniesť štandardné popisky obrázkov do štýlu príbehov z románov. Zmena štýlu bola inšpirovaná „Neurálnym algoritmom umeleckého štýlu“.

údaje

V tomto modeli sa používajú dva hlavné zdroje údajov. MSCOCO je súbor údajov od spoločnosti Microsoft obsahujúci asi 300 000 obrázkov, pričom každý obrázok obsahuje päť titulkov. MSCOCO je jediným kontrolovaným údajom, ktorý sa používa, čo znamená, že sú to jediné údaje, do ktorých ľudia museli ísť a výslovne pre každý obrázok napísať popisky.

Jedným z hlavných obmedzení neurónovej siete vpred je, že nemá pamäť. Každá predpoveď je nezávislá od predchádzajúcich výpočtov, akoby išlo o prvú a jedinú predpoveď, akú kedy sieť vytvorila. Pri mnohých úlohách, napríklad pri preklade vety alebo odseku, by však vstupy mali pozostávať zo sekvenčných a vzájomne súvisiacich údajov. Napríklad by bolo ťažké dať zmysel jedinému slovu vo vete bez toho, aby boli dané okolité slová.

RNN sú rôzne, pretože pridávajú ďalšiu skupinu spojení medzi neurónmi. Tieto prepojenia umožňujú, aby sa aktivácie z neurónov v skrytej vrstve vrátili do seba v ďalšom kroku v poradí. Inými slovami, v každom kroku skrytá vrstva prijíma tak aktiváciu z vrstvy pod ňou, ako aj z predchádzajúceho kroku v sekvencii. Táto štruktúra v podstate dáva pamäti opakujúcich sa neurónových sietí. Takže za účelom detekcie objektov môže RNN čerpať zo svojich predchádzajúcich klasifikácií psov, aby pomohla určiť, či aktuálny obraz je pes.

Char-RNN TED

Táto flexibilná štruktúra v skrytej vrstve umožňuje RNN veľmi dobré pre jazykové modely na úrovni znakov. Char RNN, pôvodne vytvorený Andrejom Karpatym, je modelom, ktorý berie jeden súbor ako vstup a trénuje RNN, aby sa naučil predpovedať ďalší znak v sekvencii. RNN môže generovať znak po znaku, ktorý bude vyzerať ako pôvodné školiace údaje. Demo bolo školené pomocou prepisov rôznych rozhovorov TED. Nakrmte model jedným alebo niekoľkými kľúčovými slovami a vygeneruje pasáž o kľúčových slovách v hlase / štýle rozhovoru TED.

záver

Tieto modely ukazujú nové objavy v strojovej inteligencii, ktoré sa stali možnými vďaka hlbokému učeniu. Hlboké učenie ukazuje, že dokážeme vyriešiť problémy, ktoré sme nikdy predtým nedokázali vyriešiť, a ešte sme nedosiahli túto plošinu. Očakávajte, že v najbližších rokoch sa objavia ďalšie zaujímavé veci, ako napríklad vozidlá bez vodiča, ako výsledok inovácií hlbokého vzdelávania.