Data Science alebo Machine Learning? Heres Ako rozpoznať rozdiel

Video: How to develop if you are Senior or Lead? Interview with Pavel Veinik. This is how developers grow.

Obsah

Dáta a strojové vzdelávanie: široká a úzka terminológia
Sady zručností v oblasti vedy o údajoch a strojovom učení
Žiadne chyby, žiadny stres - Váš sprievodca krok za krokom k vytvoreniu softvéru na zmenu života bez zničenia vášho života
Ako zistiť strojové učenie
Dva disciplíny s ostrými hranami

Zdroj: Elnur / Dreamstime.com

Zobrať:

Veda o údajoch a strojové učenie sa v kľúčových smeroch líšia. V niektorých ohľadoch jeden môže byť videný ako podskupina druhého. Obidve sú dôležité pre súčasný pokrok v oblasti IT.

V tomto novom svete umelej inteligencie a správy údajov je ľahké sa pomýliť niektorými z termínov, ktoré sa najčastejšie používajú vo svete IT.

Napríklad veda údajov a strojové učenie majú veľa spoločného so sebou. Nie je prekvapujúce, že mnohí ľudia, ktorí majú len tieto vedomosti o týchto disciplínach, by mali problém zistiť, ako sa navzájom líšia.

Toto je najlepší spôsob, ako oddeliť vedu o údajoch od strojového učenia, ako princípu a ako technologického prístupu.

Dáta a strojové vzdelávanie: široká a úzka terminológia

Po prvé, veda o údajoch je skutočne široká, zastrešujúca kategória technológií, ktorá zahŕňa mnoho rôznych typov projektov a výtvorov. (Viac informácií o úlohách v oblasti dátovej vedy nájdete v časti Úloha úlohy: Data Scientist.)

Dáta veda je v podstate prax s veľkými dátami. Ukázalo sa, že Mooreov zákon a rozširovanie efektívnejších pamäťových zariadení viedlo k tomu, že spoločnosti a iné strany zhromažďovali obrovské množstvo údajov. Potom veľké dátové platformy a nástroje ako Hadoop začali redefinovať výpočty zmenou spôsobu fungovania správy údajov. Teraz, s cloudom a kontajnerizáciou, ako aj zbrusu novými modelmi, sa veľké dáta stali hlavným hnacím motorom toho, ako pracujeme a žijeme.

V najjednoduchšej podobe je veda o údajoch spôsob, akým tieto údaje spravujeme, od ich vyčistenia a vylepšenia až po ich použitie vo forme prehľadov.

Definícia strojového učenia je omnoho užšia. V strojovom vzdelávaní technológie prijímajú údaje a prepracúvajú ich pomocou algoritmov, aby simulovali ľudské kognitívne procesy opísané ako „učenie sa“. Inými slovami, po prevzatí údajov a zaškolení na nich je počítač schopný poskytnúť svoje vlastné výsledky , kde sa zdá, že táto technológia sa poučila z procesov, ktoré zaviedli programátori.

Sady zručností v oblasti vedy o údajoch a strojovom učení

Ďalším spôsobom, ako porovnávať vedu o údajoch a strojové učenie, je pozrieť sa na rôzne zručnosti, ktoré sú pre odborníkov v týchto oblastiach najcennejšie.

Žiadne chyby, žiadny stres - Váš sprievodca krok za krokom k vytvoreniu softvéru na zmenu života bez zničenia vášho života

Svoje programovacie schopnosti si nemôžete vylepšiť, keď sa nikto nestará o kvalitu softvéru.

Existuje všeobecná zhoda v tom, že vedci údajov využívajú hlboké analytické a matematické zručnosti, praktické skúsenosti s databázovými technológiami a znalosť programovacích jazykov, ako je Python alebo iné balíčky, ktoré sa používajú na analýzu veľkých údajov.

„Každý, kto má záujem o vybudovanie silnej kariéry v oblasti (veda o údajoch), by mal získať kľúčové zručnosti na troch oddeleniach: analytika, programovanie a znalosti domén,“ píše Srihari Sasikumar zo spoločnosti Simplilearn. „Ak pôjdete hlbšie o jednu úroveň, nasledujúce zručnosti vám pomôžu vytrhnúť medzeru ako vedec údajov: Silné znalosti Pythonu, SAS, R (a) Scaly, praktické skúsenosti s kódovaním databázy SQL, schopnosť pracovať s neštruktúrovanými údajmi z rôzne zdroje, ako sú video a sociálne médiá, rozumejú viacerým analytickým funkciám (a) znalostiam strojového učenia. “

Pokiaľ ide o strojové učenie, odborníci často citujú zručnosti v oblasti modelovania údajov, pravdepodobnosti a štatistiky a širšie znalosti programovania ako užitočné nástroje v súprave nástrojov strojového učenia.

Ako zistiť strojové učenie

Kľúčom je, že všetky druhy vecí zahŕňajú prácu s údajmi, ale nejde o strojové učenie, pokiaľ nemáte nastavený veľmi prísny režim, ktorý by počítaču pomohol učiť sa z jeho vstupov.

Ak je to zavedené, vytvára to prekvapivo schopné systémy, ktoré môžu mať rozsiahle účinky na naše životy.

"Veľa z toho, čo robíme so strojovým učením, sa deje pod povrchom," uviedol zakladateľ Amazonu Jeff Bezos, ktorý poukázal na niektoré z aplikácií týchto typov systémov. „Strojové učenie poháňa naše algoritmy na predpovedanie dopytu, poradie pri vyhľadávaní produktov, odporúčania produktov a obchodov, umiestňovanie merchandisingu, zisťovanie podvodov, preklady a mnoho ďalšieho. Aj keď to bude menej viditeľné, bude mať veľký vplyv strojové učenie tohto typu - ticho, ale zmysluplne sa zlepšujú základné operácie. “

Jedným z najužitočnejších príkladov je vznik neurónovej siete - je to bežný a populárny spôsob nastavenia procesov strojového učenia.

Vo svojej najzákladnejšej podobe je nervová sieť tvorená vrstvami umelých neurónov. Každý jednotlivý umelý neurón má funkčnosť ekvivalentnú biologickému neurónu - ale namiesto synapsií a dendritov má vstupy, aktivačnú funkciu a prípadné výstupy.

Neurónová sieť je vytvorená tak, aby fungovala ako ľudský mozog, a odborníci na strojové učenie tento model často využívajú na vytváranie výsledkov strojového učenia.

Nie je to však jediný spôsob strojového učenia. Niektoré ďalšie základné strojové vzdelávacie projekty jednoducho zahŕňajú ukážku počítača širokú škálu fotografií (alebo ich dodanie s inými nespracovanými údajmi), vkladanie nápadov prostredníctvom procesu používania dohliadaných strojových učení a údajov štítkov a nechanie počítača napokon dokáže rozlišovať medzi rôzne tvary alebo predmety vo vizuálnom poli. (Základné informácie o strojovom učení nájdete v strojovom učení 101.)

Dva disciplíny s ostrými hranami

Záverom možno povedať, že strojové učenie je cennou súčasťou vedy o údajoch. Ale veda o údajoch predstavuje hranicu katastrofy a podmienky, v ktorých prebieha strojové učenie.

Určite by ste mohli povedať, že strojové učenie by sa nikdy nestalo bez veľkých dát. Samotné veľké dáta však nevytvorili strojové učenie - namiesto toho, keď sme súhrnne zhromaždili toľko údajov, že sme takmer nevedeli, čo s tým robiť, špičkové mysle prišli s týmito bioimulujúcimi procesmi ako preplňovaný spôsob. poskytovania štatistík.

Ďalšou dobrou vecou, ktorú treba mať na pamäti, je to, že veda o údajoch sa môže uplatňovať dvoma hlavnými spôsobmi - môžeme prijať strojové učenie a umelú inteligenciu, nechať počítače premýšľať o nás, alebo môžeme priniesť vedu o údajoch späť k prístupu viac zameranému na človeka, kde počítač jednoducho predstavuje výsledky a my ako ľudia robíme rozhodnutia.

Niektorí odborníci, vrátane niektorých z popredných inovátorov v dnešnej dobe, vedú k tomu, aby požadovali dôkladnejšie zúčtovanie spôsobov, akými tieto technológie používame.

„(AI) je schopný omnoho viac, ako takmer každý vie a miera zlepšenia je exponenciálna,“ uviedol Elon Musk, ktorý varuje, že strojové učenie a programy AI vyžadujú dohľad.

V každom prípade, veda o údajoch aj strojové učenie sú hlavnými súčasťami pokroku, ktorý my ako spoločnosti dnes dosahujeme v oblasti technológií.