Úloha úlohy: Data Scientist

Autor: Roger Morrison
Dátum Stvorenia: 28 September 2021
Dátum Aktualizácie: 11 Smieť 2024
Anonim
Úloha úlohy: Data Scientist - Technológie
Úloha úlohy: Data Scientist - Technológie

Obsah


Zdroj: Sergey Khakimullin / iStockphoto

Zobrať:

Vedci údajov majú rozsiahle pracovné miesta, ktoré sa v závislosti od aplikácie značne líšia. Jedna vec, ktorú majú všetci spoločné, je však snaha o dobré využitie údajov.

Čo robí vedec údajov v oblasti umelej inteligencie a strojového učenia? Veľa profesionálov, ktorí sa zaoberajú takýmito druhmi projektov každý deň, by povedalo, že na túto otázku je ťažké odpovedať jednoducho. Lepšia otázka by bola: Čo vedci údajov NIE SÚ?

Vedec údajov je neoddeliteľnou súčasťou procesu AI alebo ML v tom zmysle, že všetky tieto projekty závisia od veľkých údajov alebo zložitých vstupov. Vedec údajov je nevyhnutný kariérista, ktorý vie, ako s údajmi pracovať, aby dosiahol výsledky.

Existuje však niekoľko spôsobov, ako hovoriť o tom, čo robí vedec údajov, aké kvalifikácie potrebuje a aká je jeho úloha.


Čítať: 6 hlavných konceptov vedeckých údajov, ktoré môžete zvládnuť prostredníctvom online vzdelávania

Rôzne definície, rôzne povinnosti

Mnoho odborníkov, ktorí opisujú prácu vedcov údajov, o nej hovorí v širšom zmysle.

„V malých spoločnostiach alebo pri práci na novom trhu je úlohou údajového vedca konvertovať relatívne nové (ale zrejmé) zdroje údajov do vecí, ktoré riešia problém pre koncového používateľa, ktorý by predtým nebol možný. kde použité technológie neexistovali, “hovorí Antonio Hicks, Account Manager v spoločnosti Mercury Global Partners. „Ideálnym kandidátom je niekto, kto je matematik, softvérový inžinier a podnikateľ.“

Iní sa stotožňujú s touto základnou myšlienkou a uvádzajú, čo vedci údajov potrebujú na riešenie modelových projektov.


„Najdôležitejším atribútom, ktorý vedec údajov potrebuje, je hlboká zvedavosť o svete okolo nich - či už odpovedajú na otázky alebo vytvárajú modely, túžba porozumieť problému pred nimi je kľúčová,“ hovorí Erin Akinci, manažér vedeckých údajov. v Asane. "Odtiaľ bude väčšina ľudí vyžadovať zručnosti v matematike a programovaní, aby našli riešenia, ale konkrétne druhy matematiky a programovania sa veľmi líšia v závislosti od oblasti expertízy v oblasti dátovej vedy."

Žiadne chyby, žiadny stres - Váš sprievodca krok za krokom k vytvoreniu softvéru na zmenu života bez zničenia vášho života

Svoje programovacie schopnosti si nemôžete vylepšiť, keď sa nikto nestará o kvalitu softvéru.

„Vynikajúca vedecká práca má viac spoločného s tým, ako vedci myslia na problém, ako s nástrojmi, ktoré používajú na ich riešenie,“ dodáva Charlie Burgoyne, zakladateľ a generálny riaditeľ spoločnosti Valkyrie Intelligence. Valkyrie je poradenská spoločnosť v oblasti aplikovanej vedy s pôsobivými projektmi pod jej krídlami, ako je Mark I, špecializované sieťové zariadenie, ktoré podporuje školenie a testovanie neurónovej siete a zlepšuje to, čo je možné, s predchádzajúcimi platformami strojového vzdelávania na báze cloudu.

"Trh vyžaduje vedcov, ktorí sú odborne pripravení na vývoj Pythonu, návrh neurónovej siete a schopnosť pretvoriť archív údajov na najnovšiu databázovú architektúru," hovorí Burgoyne. „Tieto schopnosti sú však stolom pre talentovaného vedca. Menej viditeľné je, že vedci majú k dispozícii neohrozenú zvedavosť, agresívnu vynaliezavosť a dodržiavanie vedeckých metód. “

Zručnosti vedca údajov

Pokiaľ ide o praktické zručnosti, vedci údajov potrebujú, pokiaľ ide o modelovanie, určitú mieru kreativity a dôvtipu. Môžu tiež veľmi ťažiť z toho, že majú „tvrdé zručnosti“, ako je kódovanie skúseností v Pythone, C ++ alebo iných bežných jazykoch aplikovaných na projekty ML.

„Python a C ++ sú nevyhnutné a dokážu kombinovať kódovacie zručnosti s analýzou a spracovaním údajov a štatistika sú základné zručnosti, vďaka ktorým bude vedec údajov vynikať ako silný kandidát alebo zamestnanec,“ hovorí Val Streif v Pramp, online platforma na rozhovor s falošnými rozhovormi. pre softvérových inžinierov, vývojárov a vedcov údajov. „Aj keď niektoré programovacie zručnosti by sa dali vyriešiť spárovaním vedca údajov s vývojárom, je to oveľa jednoduchšie, ak máte obe zručnosti kombinované v jednom z pohľadu spoločnosti.“

Ďalší odborníci pridávajú do zoznamu R, Hadoop, Spark, Sas a Java, ako aj technológie ako Tableau, Hive a MATLAB.

Všetci sa snažia o pôsobivý životopis, ale niektorí z tých, ktorí majú skúsenosti s náborom vedcov údajov, hovoria aj o ďalších „ľudských“ vedľajších veciach. (Jedným z typov údajov je vedec údajov o občanoch. Viac sa dozviete na stránke Úloha vedcov údajov o údajoch vo svete veľkých dát.)

"Tradične, jednotlivci s rôznym vzdelaním v slobodnom umení robia vynikajúcich vedcov v oblasti údajov," hovorí Burgoyne, pričom rozlišuje medzi inžiniermi, ktorí sú na strane budovy, a vedcami údajov, ktorých práca môže byť oveľa koncepčnejšia. Pokračuje:

Odbornosť v tradičnej oblasti STEM s komplementárnym zameraním na humanitné, umelecké alebo obchodné oblasti prináša vlastnosti, ktoré sú vynikajúcim priemyselne orientovaným vedcom. Je potrebné povedať, že rovnako dôležité je, aby organizácia mohla tieto kvality využiť a formovať svoju horlivosť a metódy produktívnym spôsobom. Zaznamenal som, že keď je iniciatíva v oblasti vedy o dátume neúspešná, organizácia bude rovnako vinná ako vedci. Vedci nie sú inžinieri. Nie sú motivovaní k tomu, aby ich vykonávali a stavali. Sú motivovaní objavovať a rozumieť im. Organizácie, ktoré pochopia tento rozdiel, sú za kultiváciu oboch polí dobre odmenené.

Pokiaľ ide o to, na čo sa vedci zvyčajne vzťahujú, má to spoločné základné ciele spoločnosti. Niektoré firmy prenasledujú decentralizovaný internet - niektoré si hrajú s IoT alebo SaaS. Iní sa pokúšajú propagovať „užívateľsky prívetivé“ alebo „etické“ alebo „transparentné“ umelecké dielo.

V každom prípade vedci s údajmi pravdepodobne preklenú priepasť medzi tvrdými metrikami údajov, ktoré používajú, bez ohľadu na to, aký technologický zásobník je v hre, a prácou pri voľnom pohybe konceptualizácie funkčnosti AI / ML.

„Zamestnávame vedcov údajov, aby spravovali zhromažďovanie a čistenie údajov, ako aj prevádzame tieto údaje na zmysluplné informácie,“ hovorí Michael Hupp, manažér oddelenia Data Science and Analytics v spoločnosti G2 Crowd. Vypracováva:

Zvyčajne to znamená spravovanie všetkých dôležitých algoritmov, ktoré poháňajú údaje spoločnosti a plynule ovládajú kľúčové analytické nástroje a jazyky, ale v posledných rokoch zahŕňali aj vznikajúce oblasti, ako je spracovanie prirodzeného jazyka, strojové učenie sa, iné formy analýzy s podporou AI. Najúspešnejší vedci v oblasti údajov sú tí, ktorí kombinujú svoje tvrdé zručnosti so schopnosťou rýchlo sa učiť a so schopnosťou efektívne komunikovať informácie, ktoré odhalia, takže budú mať zmysel pre ich podnikanie.

Vďaka týmto typom poznatkov je pre mladých odborníkov alebo študentov ľahšie zistiť, či by vedecký pracovník údajov mal pre nich dobrú úlohu, a ako získať zručnosti. Štúdium STEM sa stáva dostupnejším v školách po celej krajine, nenahradzuje sa však vášeň pre kódovanie a technológiu a schopnosť učiť sa za behu.