Prečo spustiť školenie ML na lokálnom počítači a potom spustiť pravidelné vykonávanie na serveri?

Obsah

Q:

Prečo spustiť školenie strojového učenia (ML) na lokálnom počítači a potom spustiť pravidelné vykonávanie na serveri?

A:

Otázka, ako štruktúrovať projekt strojového vzdelávania a jeho fázy prípravy a skúšok, má veľa spoločného s tým, ako sa pohybujeme v „životnom cykle“ ML a prinášame program zo vzdelávacieho prostredia do produkčného prostredia.

Jedným z najjednoduchších dôvodov na použitie vyššie uvedeného modelu umiestnenia výcviku ML na lokálnom počítači a následného presunu vykonávania do systému založeného na serveri je výhoda nevyhnutného oddelenia povinností. Vo všeobecnosti chcete, aby bol tréningový súbor izolovaný, aby ste mali jasnú predstavu o tom, kde sa školenie začína a ako sa končí a kde sa začína testovanie. Tento článok KDNuggets hovorí o princípe hrubým spôsobom a zároveň prechádza niektorými ďalšími dôvodmi na izoláciu tréningových súprav na lokálnom stroji. Jedným z ďalších základných návrhov pre tento model je to, že so súbormi školení a testov na veľmi odlišných architektúrach sa nikdy nebudete mýliť pri spoločnom prideľovaní vlakov / testov!

Ďalšou zaujímavou výhodou je kybernetická bezpečnosť. Odborníci poukazujú na to, že ak máte počiatočné procesy vlaku na miestnom počítači, nemusí byť pripojený k internetu! Toto zásadne rozširuje bezpečnosť, „inkubuje“ proces, až zasiahne produkčný svet, v ktorom potom musíte do modelu servera zabudovať primerané zabezpečenie.

Niektoré z týchto „izolovaných“ modelov môžu navyše pomôcť s problémami, ako sú napr. Drift koncepcie a skryté nevýhody - princíp „nestacionality“ varuje vývojárov, že údaje „v priebehu času“ (v závislosti od toho, čo sa meria) zostávajú „rovnaké“ a že môže trvať veľa adaptability, aby sa testovacia fáza zhodovala s fázou vlaku. Alebo v niektorých prípadoch sa procesy vlaku a skúšky navzájom kombinujú a vytvárajú zmätok.

Prvé nasadenie testovacej fázy na server môže uľahčiť rôzne modely „čiernych skriniek“, v ktorých vyriešite problém s adaptabilitou údajov. V niektorých prípadoch eliminuje zbytočný proces zadávania príkazov na zmenu na viacerých platformách.

Potom tiež serverové prostredie evidentne slúži v reálnom čase alebo v dynamických procesoch, v ktorých inžinieri budú chcieť získať prístup k modelom prenosu údajov a kódov, ktoré najlepšie fungujú pri výrobe v ML. Napríklad AWS Lambda môže byť atraktívnou možnosťou pre manipuláciu s mikrofunkciami výroby (alebo kombináciou ukladania objektov Lambda a S3) a bez možnosti pripojenia (bez servera), čo sa stáva nemožným.

Toto sú niektoré z problémov, ktoré môžu vývojári premýšľať, keď uvažujú o tom, ako rozdeliť tréningové fázy ML od testovania a výroby.