12 kľúčových tipov na učenie sa dátových vied

Autor: Laura McKinney
Dátum Stvorenia: 3 Apríl 2021
Dátum Aktualizácie: 1 V Júli 2024
Anonim
12 kľúčových tipov na učenie sa dátových vied - Technológie
12 kľúčových tipov na učenie sa dátových vied - Technológie

Obsah


Zdroj: Artinspiring / Dreamstime.com

Zobrať:

Vedci údajov očividne potrebujú silné matematické a kódovacie zručnosti, ale pre úspech sú nevyhnutné aj komunikačné a iné mäkké zručnosti.

Vedec údajov sa radí ako najlepšia práca pre rok 2019 v Amerike na Glassdoor. S priemerným základným platom 108 000 dolárov a úrovňou spokojnosti s prácou 4,3 z 5 plus predpokladaným otvoreným počtom pracovných miest to nie je prekvapujúce. Otázka znie: Čo musí človek urobiť, aby sa dostal na cestu, aby sa mohol kvalifikovať na túto prácu?

Aby sme to zistili, hľadali sme rady poskytnuté tým, ktorí sa snažia dostať na túto kariéru. Veľa problémov s kódovaním a matematikou. Samotné silné výpočty ho však nezastavia. Úspešní vedci v oblasti údajov musia byť schopní hovoriť aj s podnikateľmi samostatne, čo si vyžaduje schopnosti spojené s mäkkými zručnosťami a vodcovstvom. (Ak sa chcete dozvedieť viac o povinnostiach vedca údajov, prečítajte si článok Úloha úlohy: Vedec údajov.)


Budovanie vzdelávacej nadácie: Tri základné tipy

Drace Zhan, vedkyňa údajov na Akadémii vedy s údajmi v NYC, zdôrazňuje potrebu vzdelávacej nadácie, ktorá obsahuje základy kódovania a matematických schopností:

  1. R / Python + SQL. Ak nemáte skúsenosti s kódovaním, na prekonanie tohto deficitu potrebujete veľa sieťového napájania a ďalšie oblasti. Videl som vedcov s údajmi so slabými skúsenosťami s matematikou a malými doménami, vždy ich však niesla silná schopnosť kódovania. Python je ideálny, ale R je skvelý nástroj na zaostávanie. Najlepšie je mať oboje vo svojom arzenáli. SQL je tiež mimoriadne dôležitý pre Data Analyst.

  2. Silné matematické zručnosti. Veľmi dobre rozumieť niekoľkým bežne používaným metódam: zovšeobecnené lineárne modely, rozhodovací strom, K-priemery a štatistické testy sú lepšie ako mať všeobecný obraz o rôznych modeloch alebo špecializácii, ako je RNN.

Sú to základné zručnosti, na ktorých sa dá stavať, hoci k nim niektorí odborníci prispievajú. Napríklad zoznam KDnuggets obsahuje komponenty kódovania, ktoré Zhan spomínal, a dodáva ďalšie užitočné veci, ktoré je potrebné vedieť na technickej stránke, vrátane platformy Hacheop Apache Spark, vizualizácie údajov, neštruktúrovaných údajov, strojového učenia a umelej inteligencie.


Ak však z prieskumu o najbežnejšie používaných nástrojoch identifikovaných na použitie v reálnom živote pomocou prieskumu spoločnosti Kaggle vyberieme, dostaneme trochu odlišné výsledky. Ako vidíte z grafu najlepších 15 možností nižšie, Python, R a SQL sa ľahko umiestnili na prvých troch miestach, ale štvrtým sú notebooky Jupyter, po ktorých nasledujú TensorFlow, Amazon Web Services, unixový shell, Tableau, C / C ++, NoSQL. , MATLAB / Octave a Java, všetky pred Hadoopom a Sparkom. Ďalším prírastkom, ktorý môže ľudí prekvapiť, je Microsoft Excel Data Mining.

Obrázok s láskavým dovolením spoločnosti Kaggle

Zoznam KDnuggets obsahuje aj tip týkajúci sa formálneho vzdelávania. Väčšina vedcov s údajmi má pokročilé tituly: 46 percent má titul PhD a 88 percent má najmenej magisterský titul. Vysokoškolské tituly, ktoré vlastnia, sa vo všeobecnosti delia na súvisiace oblasti. Asi tretina je v matematike a štatistike, čo je pre túto kariéru najpopulárnejšie. Ďalším najobľúbenejším je vysokoškolský titul v odbore počítačová veda, ktorý vlastní 19 percent, a inžinierstvo, výber 16 percent. Technické nástroje, ktoré sa osobitne týkajú vedy o údajoch, sa, samozrejme, často neštudujú v študijných programoch, ale v špecializovaných boot táboroch alebo online kurzoch.

Viac ako kurzy: Dva ďalšie tipy

Hank Yun, výskumný asistent v pľúcnom oddelení vo Weill Cornell Medicine a študent na Akadémii vedy s údajmi NYC, radí začínajúcim vedcom údajov, aby naplánovali, na čom budú pracovať a našli mentora. Povedal:

Žiadne chyby, žiadny stres - Váš sprievodca krok za krokom k vytvoreniu softvéru na zmenu života bez zničenia vášho života

Nemôžete zlepšiť svoje programovacie schopnosti, keď sa nikoho nezaujíma o kvalitu softvéru.

Nerobte chybu, ktorú som urobil tým, že ste si povedali, že viete o vede údajov, pretože ste sa zúčastnili kurzu a dostali certifikát. Je to skvelý začiatok, ale keď začnete študovať, choďte na projekt. Potom nájdite mentora v teréne a ihneď začnite vášnivý projekt! Keď ste čerství, neviete, čo neviete, takže vám pomôže, keď je niekto k dispozícii, aby vás nasmeroval na to, čo je pre vás dôležité a čo nie. Nechcete tráviť veľa času štúdiom s ničím, čo by ste mu mohli ukázať!

Vedieť, ktorý nástroj vybrať zo svojej sady nástrojov: Tip, ako zostať pred krivkou

Vzhľadom na rozdiely v rebríčku nástrojov vedy o údajoch sa môžu niektorí cítiť zmätení, na čo sa majú zamerať. Celeste Fralick, vedecký pracovník v oblasti bezpečnostného softvéru McAfee, rieši tento problém v článku CIO, ktorý sa zameriava na základné zručnosti pre vedca údajov a vyhlásil: „Vedec údajov musí zostať pred krivkou vo výskume, ako aj pochopiť, ktorú technológiu použiť, keď. “To znamená, že„ lákavé “„ sexy “a nové, keď skutočný problém vyžaduje niečo oveľa bežnejšie. „Uvedomenie si výpočtových nákladov na ekosystém, interpretovateľnosť, latencia, šírka pásma a ďalšie okrajové podmienky systému - ako aj vyspelosť zákazníka - samotnému vedcovi údajov pomáha pochopiť, ktorá technológia sa má uplatniť.“

Základné mäkké zručnosti: Ďalších šesť tipov

Bod, ktorý vychováva Fralick, sa týka netechnických zručností, ktoré vyžaduje práca vedcov údajov. Z tohto dôvodu obsahuje zoznam KDnuggets tieto štyri: intelektuálnu zvedavosť, tímovú prácu, komunikačné schopnosti a obchodný dôraz. Zhan tiež zahrnul kľúčové mäkké zručnosti do svojich tipov pre vedcov v oblasti údajov, pričom identifikoval „komunikačné zručnosti“ ako je KDnuggets, ale namiesto „business acumen“ používal „odborné znalosti z oblasti“. Čokoľvek sa to nazýva, týka sa to praktického uplatňovania dátovej vedy na business. (Viac informácií o komunikačných schopnostiach nájdete v časti Význam komunikačných zručností pre technických odborníkov.)

Olivia Parr-Rud ponúkla svoje vlastné točenie, pridala ďalšie dve mäkké zručnosti, s dôrazom na úlohu kreativity, tvrdiac: „Myslím si, že veda o údajoch je rovnako umenie ako veda,“ čo si vyžaduje čerpanie z silné stránky oboch strán mozgu. „Mnoho ľudí hovorí o vede údajov ako o kariére, ktorá využíva predovšetkým ľavý mozog. Zistil som, že ak majú byť vedci údajov úspešní, musia používať celý mozog. “

Vysvetlila, že pokrok v tejto oblasti si vyžaduje nielen technickú spôsobilosť, ale aj kreativitu a víziu potrebnú na vedenie:

Väčšina úloh v ľavom mozgu / lineárnom režime môže byť automatizovaná alebo zadaná externe. Aby sme ako vedci údajov ponúkli konkurenčnú výhodu, musíme byť schopní rozoznať vzorce a syntetizovať veľké množstvo informácií pomocou oboch strán nášho mozgu. A my musíme byť inovatívni myslitelia. Mnoho najlepších výsledkov vyplýva z integrácie ľavého a pravého mozgu.

Zdôraznila tiež, že komunikácia vízie je nevyhnutná:

Ako vedci údajov je naším cieľom používať údaje, ktoré pomôžu našim klientom zvýšiť svoje zisky. Väčšina vedúcich pracovníkov nechápe, čo robíme alebo ako to robíme. Preto musíme myslieť ako vodcovia a sprostredkovať naše zistenia a odporúčania v jazyku, ktorému naši zúčastnené strany rozumejú a ktorým dôverujú.

Dozen dát

Kľúčové tipy zahŕňajú väčší počet technických nástrojov, zručností a schopností, ako aj menej kvantifikovateľné vlastnosti, ako je schopnosť tvorivosti a vodcovstva. Nakoniec to nie je len hra s číslami. Keďže veda o údajoch nie je len o vytváraní modelov vo vákuu, ale o vymýšľaní praktických aplikácií na riešenie problémov v skutočnom živote pre podniky, tí, ktorí uspejú v tejto oblasti, musia nielen zvládnuť technológie, ale poznať svoju obchodnú oblasť a pochopiť potreby rôzni členovia tímu v práci.