Sila návrhu: Ako katalóg údajov zmocňuje analytikov

Zobrať: Hostiteľka Rebecca Jozwiak diskutuje o výhodách katalógov údajov s Dezom Blanchfieldom, Robinom Bloorom a Davidom Crawfordom.

Na prezeranie videa sa musíte zaregistrovať pre túto udalosť. Zaregistrujte sa a pozrite si video.

Rebecca Jozwiak: Dámy a páni, Zdravíme vás a vítame vás v Hot Technologies roku 2016. Dnes sme dostali: „Sila návrhov: Ako katalóg údajov zmocňuje analytikov.“ Som vaša hostiteľka Rebecca Jozwiak a dnes vyplňujem nášho zvyčajného hostiteľa Eric Kavanagha, zatiaľ čo on cestuje po svete, preto ďakujeme, že ste sa k nám pripojili. Tento rok je horúco, nie je to len horúco v Texase, kde som, ale je horúce všade. Vyskytuje sa výbuch všetkých druhov nových technológií. Weve dostal IoT, streamovanie dát, cloudové zavádzanie, Hadoop naďalej dozrie a bol prijatý. Máme automatizáciu, strojové učenie a všetky tieto veci sú samozrejme podčiarknuté údajmi. A podniky sa stávajú čoraz viac údajmi zo dňa na deň. A samozrejme to má viesť k poznávaniu a objavovaniu a, ako viete, k lepším rozhodnutiam. Na to, aby sme z údajov mohli čo najviac vyťažiť, je potrebné sa k nim ľahko dostať. Ak ho budete držať uzamknutý alebo pochovaný alebo v mozgu niekoľkých ľudí v rámci podniku, nebude to pre spoločnosť ako celok prínosom.

A tak som premýšľal o katalogizácii údajov a o chode knižníc, kde som už dávno šiel tam, kam si potreboval niečo nájsť, potreboval si preskúmať tému, alebo si našiel nejaké informácie, chodil si do knižnice , a samozrejme ste išli do katalógu kariet alebo do krabej dámy, ktorá tam pracovala. Bolo však tiež zábavné sa túlať po okolí, ak ste sa len chceli pozrieť a určite by ste mohli objaviť niečo úhľadné, mohli by ste zistiť niektoré zaujímavé skutočnosti, ktoré ste nevedeli, ale ak ste skutočne niečo potrebovali, a vedeli ste, čo ste hľadali, potrebovali ste katalóg kariet a podnikovým ekvivalentom je samozrejme katalóg údajov, ktorý môže pomôcť objasniť všetky údaje, ktoré naši používatelia môžu obohatiť, objaviť, zdieľať, konzumovať a skutočne pomôcť ľuďom získať na dáta rýchlejšie a ľahšie.

Takže dnes sme dostali nášho vlastného vedca údajov Deza Blanchfielda a máme vlastného vedúceho analytika doktora Robina Bloora, ktorý dostal Davida Crawforda z Alation, ktorý bude hovoriť o príbehu katalogizácie údajov svojej spoločnosti, ale najskôr pôjdeme viesť Dez. Dez, odovzdávam ti loptu a podlaha je tvoja.

Dez Blanchfield: Ďakujem vám, že ste ma dnes dostali. Toto je záležitosť, o ktorú ma veľmi zaujíma, pretože takmer v každej organizácii, s ktorou sa stretávam vo svojej každodennej práci, nachádzam presne ten istý problém, o ktorom sme sa veľmi krátko zmienili v predbežnej prehliadke, a to je to, že väčšina organizácií, ktoré podnikajú viac ako niekoľko rokov, má v organizácii nespočetné množstvo údajov, rôzne formáty a v skutočnosti mám klientov, ktorí majú súbory údajov, ktoré siahajú späť do Lotus Notes, databáz, ktoré sú stále v niektorých prípady ako ich pseudointernety a oni všetci čelia tejto výzve, keď skutočne zisťujú, kde sú ich údaje a ako k nim získať prístup, kto im poskytne prístup, kedy im poskytne prístup a ako spravodlivo katalóg a ako sa dostať na miesto, kde môže každý: A) vedieť, čo je tam a čo je v ňom, a B), ako k nemu získať prístup a používať ho. Jednou z najväčších výziev je, samozrejme, jej nájdenie, ďalšou veľkou výzvou je vedieť, čo je tam a ako k nej získať prístup.

Možno dobre viem, že mám desiatky databáz, ale vlastne neviem, čo tam je alebo ako zistím, čo tam je, a tak neustále, ako teraz objavujeme údaje v predbežnom zobrazení, máte tendenciu chodiť okolo kancelárie a klásť otázky a kričať cez kubické steny a snažiť sa prísť na to, často moje skúsenosti sú, že by ste dokonca mohli zistiť, že ste putovali pred recepciu, recepciu a pýtali sa, či niekto vie, kto ste. idem s tebou hovoriť. Pomerne často to nie je vždy ľud IT, pretože nepozná súbor údajov, pretože ho niekto práve vytvoril a mohlo by to byť niečo jednoduché ako - dosť často nájdeme projekt nejakého druhu, ktorý stojí v prostredí IT a projektový manažér použil tabuľku všetkých vecí a dostal obrovské množstvo cenných informácií o aktívach, koncoch a menách, a pokiaľ tento projekt nepoznáte a nepoznáte túto osobu, tieto informácie jednoducho nemôžete nájsť. Nie je k dispozícii a vy musíte tento originálny súbor chytiť.

Existuje fráza, ktorá bola zakázaná v súvislosti s údajmi, a ja s ňou nevyhnutne nesúhlasím, ale myslím si, že je to roztomilý malý únik a to je to, že určité množstvo ľudí si myslí, že údaje sú nový olej, a som si istý, že Budem sa to zaoberať aj v niektorých aspektoch, neskôr dnes. Čo som si však všimol, určite je súčasťou tejto transformácie, je to, že organizácie podnikov, ktoré sa naučili vážiť si svoje údaje, získali oproti svojim konkurentom značnú výhodu.

Asi pred piatimi alebo šiestimi rokmi mala spoločnosť IBM zaujímavý dokument, ktorý prieskumoval okolo 4 000 spoločností tu v Austrálii a vzali všetky informácie, všetky údaje o výkonnosti, všetky finančné údaje a dali ich dohromady do vriaceho hrnca a potom poslali ju na austrálsku ekonomickú školu a v skutočnosti tu začali spoločný trend, a to je to, že spoločnosti, ktoré využívajú technológiu, vždy získali takú konkurenčnú výhodu nad svojimi rovesníkmi a konkurentmi, že ich konkurenti takmer nikdy dobehli, a myslím si, to je v súčasnosti veľmi veľa údajov, ktoré sme videli, čo ľudia nazývajú digitálna transformácia, kde organizácie, ktoré jednoznačne prišli na to, ako nájsť údaje, ktoré majú, sprístupňujú tieto údaje a sprístupňujú ich v niektorých veľmi ľahko dostupných spôsobom, bez toho, aby vždy vedeli, prečo to organizácia môže potrebovať, a získať významnú výhodu oproti konkurentom.

Na tejto snímke je niekoľko príkladov, ktoré môžete vidieť. Moja jediná zostava je, že podľa môjho názoru sú rozsiahle narušenia takmer vo všetkých odvetviach priemyslu poháňané údajmi, a ak súčasné trendy majú čo doháňať, môj názor je, že sme sa skutočne dostali začalo, pretože keď sa dlhodobé značky konečne prebudia, čo to znamená a vstúpia do hry, vstúpia do hry vo veľkoobchode. Keď niektorí hlavní maloobchodníci, ktorí majú údaje o horách, začnú na údaje uplatňovať nejakú historickú analýzu, ak dokonca vedia, že existujú, niektorí z online hráčov dostanú trochu prebudenia.

Ale s mnohými z väčšiny týchto značiek mám na mysli, že máme Ubera, ktorý je najväčšou taxislužbou na svete. Nemajú žiadne taxíky, takže čo ich robí kúzelnými, aké sú ich údaje? Airbnb, najväčší poskytovateľ ubytovania, máme WeChat, najväčšiu telefónnu spoločnosť na svete, nemajú však skutočnú infraštruktúru a žiadne telefóny ani telefónne linky. Alibaba, najväčší maloobchodník na tejto planéte, ktorý však nevlastní žiadny zo súpisov. , najväčšia mediálna spoločnosť v slove. Myslím si, že v poslednej dobe mali teraz 1,4 miliardy aktívnych používateľov údajov, čo je ohromujúce číslo. Nie je to blízko - myslím, že niekto tvrdil, že štvrtina planéty je tu každý deň, a napriek tomu tu je poskytovateľ obsahu, ktorý skutočne nevytvára obsah, všetky údaje, ktoré slúžia, nie sú nimi vytvorené, sú vytvárané ich predplatiteľov a všetci vieme tento model.

SocietyOne, o ktorej ste možno alebo možno nepočuli, je to miestna značka. Myslím si, že v niekoľkých krajinách je to banka, ktorá skutočne poskytuje pôžičky typu peer-to-peer, inými slovami, nemá peniaze. Všetko, čo robí, je to, že riadi transakcie a údaje sú umiestnené pod nimi. Netflix, všetci sme s tým veľmi dobre oboznámení. Je tu zaujímavá vložka. Keď sa Netflix legálne mohol používať v Austrálii, keď to bolo oficiálne oznámené, nemuseli ste na to používať VPN, veľa ľudí na celom svete má tendenciu - ak sa k nemu nemôžete dostať vo vašej miestnej oblasti - keď Netfix bol uvedený na trh v Austrálii, čím sa zvýšila medzinárodná šírka pásma na našich internetových linkách o 40 percent, takže sa v noci takmer zdvojnásobilo využívanie internetu v Austrálii, a to iba jednou aplikáciou, jednou aplikáciou typu cloud-hosted, ktorá nerobí nič iné ako hrať s údajmi. Je to iba ohromujúca štatistika.

A samozrejme, všetci sme oboznámení s Apple a Google, ale toto sú najväčšie softvérové firmy na tejto planéte, napriek tomu tieto aplikácie vlastne nepíšu. Čo je konzistentné so všetkými týmito organizáciami? Sú to údaje a oni sa tam nedostali, pretože nevedeli, kde sú ich údaje, a nevedeli, ako ich katalogizovať.

Teraz zisťujeme, že celá táto nová trieda aktív sa označuje ako údaje a spoločnosti sa prebúdzajú. Nemajú však vždy nástroje a know-how a preto musia mapovať všetky tieto údaje, katalogizovať všetky tieto údaje a sprístupniť ich. Zistili sme však, že spoločnosti s takmer žiadnym fyzickým majetkom získali v rekordnom čase vysokú trhovú hodnotu. prostredníctvom tejto novej triedy dátových prostriedkov. Ako som už povedal, niektorí zo starých hráčov sa teraz preberajú a určite to vyvedú.

Som veľkým fanúšikom toho, že si vezmem ľud na malú cestu, takže v osemnástich stovkách, neskoro osemnástych stovkách, a budete sa toho viac než oboznámiť na americkom trhu, ukázalo sa, že vedie sčítanie každý rok asi tak, myslím, že ich v tom čase spravovali každých desať rokov, ale ak sa chystáte vykonať sčítanie ľudu každý rok, mohlo by to trvať až osem alebo deväť rokov, kým sa analýza údajov skutočne uskutoční. Ukázalo sa, že tento súbor údajov sa potom ponechal v škatuliach na miestach v papieri a takmer ho nikto nemohol nájsť. Tieto správy stále čerpali, ale skutočné údaje sa k nim veľmi ťažko dostali, máme podobnú situáciu s iným svetovým významným okamihom, okolo štyridsiatych rokov minulého storočia, s druhou svetovou vojnou, a to je Bletchley Park Bombe, ktorý hláskoval BOMBE. , a bol to obrovský analytický nástroj na rozbíjanie čísel, ktorý by prešiel malými množinami údajov a našiel v ňom signály, a použil by sa na pomoc pri rozbíjaní kódov cez Enigmu.

Táto vec bola opäť v podstate zariadením navrhnutým, nie príliš na katalogizáciu, ale na označovanie a mapovanie údajov a umožnenie odoberania vzorov a ich nájdenia v súboroch údajov, v tomto prípade, zlomových kódov, nájdenie kľúčov a fráz a nájdenie pravidelne v súboroch údajov, a tak sme prešli touto cestou hľadania vecí v údajoch a viedli sme k katalogizácii údajov.

A potom prišli tieto veci, tieto masívne nízkonákladové regály strojov, len stroje, ktoré sa nenachádzajú v regáloch. A urobili sme niekoľko veľmi zaujímavých vecí a jednou z vecí, ktoré sme s nimi urobili, je vybudovanie klastrov s veľmi nízkymi nákladmi, ktoré by mohli začať indexovať planétu, a veľmi dobre tieto veľké značky prichádzali a odchádzali, ale pravdepodobne je Google najbežnejším domovom. značka, o ktorej sme všetci počuli - stalo sa skutočným slovesom a viete, že ste úspešní, keď sa z vašej značky stane sloveso. Čo nás však Google naučil bez toho, aby si to uvedomil, možno v obchodnom svete, je to, že dokázali indexovať celú planétu na určitú úroveň a katalogizovať údaje, ktoré boli na celom svete, a sprístupniť ich veľmi ľahko, pohodlný formulár v malej malej jednoriadkovej receptúre, webová stránka, na ktorej je takmer nič, a napíšete svoj dopyt, ide a nájde ho, pretože už planétu už indexovo prehľadali, indexovali a ľahko sprístupnili.

A čo sme si všimli, bolo: „Dobre, vydržíme to v organizáciách - prečo je to tak? Prečo je to, že máme organizáciu, ktorá dokáže mapovať celú planétu a indexovať ju, indexovo prehľadávať a indexovať a sprístupňovať ju, môžeme ju vyhľadať a potom kliknúť na vec a nájsť ju, ako to, že to sa nedá urobiť interne? “Takže existuje veľa týchto malých stojanov strojov po celom svete, ktoré to teraz robia pre intranety a hľadajú veci, ale stále sa naozaj len vyrovnávajú s myšlienkou prekročiť tradičnú webovú stránku, alebo súborový server.

Namiesto toho, aby sme teraz vstupovali do tejto ďalšej generácie dátového katalógu mnohými spôsobmi, objavovanie prístupu k údajom prostredníctvom poznámok post-it a konverzácií s vodným chladičom už nie je v skutočnosti vhodnou metódou na zisťovanie a katalogizáciu údajov a v skutočnosti si nemyslím, že to niekedy bolo. , Nemôžeme už viesť túto celú výzvu ľuďom, ktorí len posielajú poznámky, posielajú poznámky a rozprávajú sa o tom. Teraz sme dobre a skutočne za hranicami, v ktorých tento prístup k katalogizácii údajov budúceho genómu prišiel a odišiel. Musíme to objať. Keby to bol ľahký problém, už by sme ho vyriešili už mnohými spôsobmi, ale myslím si, že to nie je ľahký problém, iba indexovanie a volanie údajov je iba jednou jeho časťou, pretože vieme, čo je v údajoch, a budujeme metadáta. okolo toho, čo objavíme, a potom ho sprístupníme v ľahkej konzumnej forme, najmä pre samoobslužné a analytické účely. Je to stále problém, ktorý sa má vyriešiť, ale mnohé časti skladačky za päť rokov sú dobre a skutočne vyriešené a dostupné.

Ako vieme, údaje o katalogizácii ľudí sú receptom na zlyhanie, pretože ľudská chyba je jednou z najväčších nočných morí, s ktorými sa zaoberáme pri spracovaní údajov, a pravidelne o tejto téme hovorím, kde podľa môjho názoru sú ľudia, ktorí vyplňujú papierové formuláre, pravdepodobne najväčšou nočnou morou. zaoberáme sa veľkými dátami a analytikou, neustálym opravovaním vecí, ktoré robia, a to aj po jednoduchých veciach, ako sú dátumy a polia, ľudia ich uvádzajú v nesprávnom formáte.

Ako som však už povedal, každý deň sme videli internetové vyhľadávacie nástroje indexovať svet, takže teraz robíme myšlienku, že to možno urobiť v súboroch obchodných údajov v procese zisťovania, a nástroje a systémy sú teraz ľahko dostupné, ako sa dnes chystáte naučiť. Trik je teda podľa môjho názoru výberom správnych nástrojov, najlepších nástrojov pre danú prácu. A ešte vhodnejšie je nájsť tú správnu časť, ktorá vám pomôže začať touto cestou. A verím, že o tom budeme dnes počuť, ale skôr ako to urobíme, pôjdem na svoju školu Robin Bloor a vypočujem si jeho tému. Robin, môžem ťa preniesť?

Robin Bloor: Áno, určite môžete. Uvidíme, či to funguje, ach áno. Dobre, prichádzam z iného smeru, ako je Dez, ale nakoniec skončím na rovnakom mieste. Ide o pripojenie k údajom, tak som si myslel, že prejdem realitou pripojenia k údajom, skutočne bod po bode.

Faktom je, že údaje sú fragmentovanejšie ako kedykoľvek predtým. Objem údajov síce fenomenálne rastie, ale v skutočnosti rôzne zdroje údajov tiež rastú neuveriteľnou rýchlosťou, a preto sa údaje stále viac fragmentujú. Ale najmä kvôli analytickým aplikáciám - ale nie sú to jediné aplikácie - máme naozaj dobrý dôvod na pripojenie ku všetkým týmto údajom, takže sme uviaznutí v náročnom mieste, uviaznutí vo svete fragmentovaných údajov, a v údajoch je príležitosť, ako to nazýval Dez, nový olej.

Čo sa týka údajov, žilo to na rotujúcich diskoch, buď v súborových systémoch alebo v databázach. Teraz žije v oveľa rozmanitejšom prostredí, žije v súborových systémoch, ale v súčasnosti tiež žije v inštanciách Hadoop alebo dokonca v prípadoch Spark. Žije vo viacerých druhoch databázy. Nie je to tak dávno, čo sme štandardizovali nejakú relačnú databázu, viete, že za posledných päť rokov vyšlo okno, pretože existuje potreba databáz dokumentov a databáz grafov, takže viete, hra má zmenilo. Žilo to na rotujúcom disku, ale teraz žije na SSD. Najnovšie množstvo SSD - určite najnovšia jednotka SSD vychádza od spoločnosti Samsung - dvadsať gigabajtov, čo je obrovské. Teraz to žije v pamäti v tom zmysle, že prvotná kópia údajov môže byť v pamäti, a nie na disku, ktoré sme predtým nepoužívali na vytváranie systémov; my teraz. A žije v oblaku. Čo znamená, že môže žiť v ktorejkoľvek z týchto vecí, v cloude, nemusíte nevyhnutne vedieť, kde sa nachádza v cloude, budete mať iba jeho adresu.

Len aby sme sa dostali domov, Hadoop zatiaľ zlyhal ako rozšíriteľný dátový sklad. Dúfali sme, že sa to stane rozšíriteľným dátovým úložiskom s rozšíriteľným rozsahom a že sa stane len jedným súborovým systémom pre všetko, čo by sa dalo - na oblohe sa objavia dúhy, v podstate a jednorožce sa budú tancovať okolo, a nič z toho sa nestalo. Čo znamená, že sme skončili s problémom prenosu údajov a niekedy nie je potrebné prenášať údaje, ale je to tiež problém. Dáta dnes v skutočnosti majú gravitáciu, keď sa dostanete do multiterabytov údajov, zdvihnete ich a rozhadzujete, spôsobujú latencie, ktoré sa objavia vo vašej sieti alebo sa objavia na rôznych miestach. Ak chcete prenášať údaje v okolí, načasovanie je faktor. V súčasnosti existujú takmer vždy obmedzenia, koľko času musíte na to, aby ste dostali jednu vec, jedno údaje z jedného miesta na druhé miesto. Bývaly to, čo sme si mysleli ako dávkové okná, keď bol stroj trochu nečinný, a bez ohľadu na to, koľko údajov ste mali, mohli ste ich jednoducho vyhodiť a všetko by fungovalo. To je preč, žijeme v oveľa väčšom svete v reálnom čase. Preto je načasovanie faktorom. Akonáhle chcete dáta presunúť, takže ak majú dáta gravitáciu, pravdepodobne ich nemôžete presunúť.

Správa údajov je faktorom v tom zmysle, že ste skutočne museli spravovať všetky tieto údaje, ktoré nedostanete bezplatne, a preto môže byť potrebná replikácia, aby ste mohli skutočne získať údaje na vykonanie úlohy, ktorú potrebuje, pretože to môže nebyť kdekoľvek si to dal. Nemusí mať dostatočné zdroje na to, aby mohla vykonávať bežné spracovanie údajov. Dáta sa teda replikujú a údaje sa replikujú viac, ako by ste si predstavovali. Myslím, že mi niekto dávno povedal, že priemerná časť údajov sa replikuje najmenej dva a polkrát. ESB alebo Kafka predstavujú možnosť pre tok dát, ale v súčasnosti to vyžaduje architektúru. V dnešnej dobe skutočne musíte tak či onak premýšľať o tom, čo to vlastne znamená hádzať údaje. Preto je spravidla vhodnejšie pristupovať k údajom tam, kde sú, pokiaľ samozrejme získate požadovaný výkon, keď v skutočnosti idete na údaje a to závisí od kon. Takže je to aj tak ťažká situácia. Pokiaľ ide o dátové dopyty, zvykli sme si myslieť z hľadiska SQL, vždy sme prišli naozaj teraz, viete, rôzne formy dotazov, SQL áno, ale susedné, tiež grafové otázky, Spark je iba jedným z príkladov grafu , pretože tiež musíme hľadať, viac ako kedykoľvek predtým, aj regulárny typ vyhľadávaní, čo je skutočne zložité vyhľadávanie vzorov a skutočné prispôsobenie vzorov, všetky tieto veci v skutočnosti prebublávajú. A všetky z nich sú užitočné, pretože vás dostanú tým, čo hľadáte, alebo vás môžu dostať to, čo hľadáte.

Dopyty teraz pokrývajú viacero údajov, takže sa to vždy nestalo a výkon je často nepríjemný, ak tak urobíte. Závisí to od okolností, ale ľudia očakávajú, že budú môcť vyhľadávať údaje z viacerých zdrojov údajov, takže federácia údajov jedného druhu sa stáva čoraz aktuálnejšou. Virtualizácia údajov, ktorá je v závislosti od výkonu odlišným spôsobom, je tiež veľmi bežná. Dotazy na údaje sú vlastne súčasťou procesu, nie celého procesu. Je len potrebné zdôrazniť, že ak sa skutočne pozeráte na analytický výkon, skutočná analytika môže trvať omnoho dlhšie ako zhromažďovanie údajov, pretože to závisí od okolností, ale ak chcete robiť akékoľvek otázky, sú absolútne nevyhnutné údaje o nich. analytika na viacerých zdrojoch údajov a len musíte skutočne mať možnosti, ktoré pokrývajú.

Takže o katalógoch.Katalógy existujú z nejakého dôvodu, prinajmenšom hovoríme, že, viete, jeho, máme adresáre a máme schémy v databázach, a máme každý katalóg a my, kamkoľvek idete, nájdete jedno miesto a potom skutočne zistíte, že existuje nejaký katalóg a zjednotený globálny katalóg je očividne dobrý nápad. Ale len veľmi málo spoločností má takú vec. Pamätám si, už v roku dvetisíc - panike dvetisíc rokov - pamätám si, že komunisti nedokázali ani určiť, koľko spustiteľných súborov mali, nezáleží na tom, koľko rôznych dátových skladov mali, a pravdepodobne je to tak teraz viem, že väčšina spoločností v globálnom zmysle aktívne nevie, aké údaje majú. Je zrejmé, že je čoraz nevyhnutnejšie mať globálny katalóg alebo aspoň mať globálny obraz o tom, čo sa deje v dôsledku rastu zdrojov údajov a pokračujúceho rastu aplikácií, a to je obzvlášť potrebné pre analytiku, pretože tiež jedným spôsobom, a sú tu aj ďalšie problémy, ako napríklad počet riadkov a problémy s údajmi, a je potrebné pre bezpečnosť, veľa aspektov správy údajov, ak naozaj neviete, aké údaje máte, myšlienku, že riadia to, je jednoducho absurdné. Takže v tomto prípade sú všetky údaje katalogizované nejakým spôsobom, je to len fakt. Otázka znie, či je katalóg koherentný a čo s tým vlastne môžete urobiť. Takže pôjdem späť do Rebeccy.

Rebecca Jozwiak: Dobre, vďaka Robin. Až nasledujúceho sme dostali Davida Crawforda z Alation, Davida idem ďalej a odovzdať loptu vám, a môžete si ho vziať preč.

David Crawford: Ďakujem ti veľmi pekne. Naozaj si cením, že ma máte na tejto show. Myslím, že to začnem, takže si myslím, že mojou úlohou tu je zobrať časť tejto teórie a zistiť, ako sa v skutočnosti uplatňuje, a výsledky, ktoré sme schopní riadiť u skutočných zákazníkov, a tak môžete vidieť pár na snímke, chcem hovoriť o tom, aké výsledky uvidíme pri analytických možných vylepšeniach. Aby sme motivovali diskusiu, budeme hovoriť o tom, ako sa tam dostali. Mám teda šťastie, že môžem veľmi úzko spolupracovať s mnohými skutočne inteligentnými ľuďmi, týmito zákazníkmi, a chcem len poukázať na pár ľudí, ktorí boli schopní skutočne zmerať, a hovoriť o tom, ako ovplyvnil dátový katalóg ich analytikov. pracovný tok. A aby som zostal v popredí, myslím si, že jednou z vecí, ktoré vidíme zmeniť, s dátovými katalógmi verziami predchádzajúce sprostredkované riešenia a jedným zo spôsobov, ako vzťahy skutočne premýšľajú o riešeniach, ktoré sme dali dokopy, je začať od analytikov. a pracovať späť. Povedzme to o tom, ako umožniť produktivite analytikov. Na rozdiel od jednoduchého dodržiavania predpisov alebo iba inventarizácie robíme nástroj, ktorý zvyšuje produktivitu analytikov.

Takže, keď hovorím s údajovým vedcom v spoločnosti Financial Services Company Square, je tu chlapík, Nick, ktorý nám hovoril o tom, ako jeho, zabral niekoľko hodín, aby našiel ten správny súbor údajov, aby mohol začať správu, teraz môže urobte to behom niekoľkých sekúnd pomocou vyhľadávania podľa trhového podielu, rozprávali sme sa s ich CTO, ktorý pritiahol svojich analytikov, ktorí používali Square, ospravedlňte ma, používali Alation, aby zistili, aké sú ich výhody, aké výhody videli, a oznámili 50 percentuálna podpora produktivity a že jeden z popredných svetových maloobchodníkov, eBay, má viac ako tisíc ľudí, ktorí pravidelne vykonávajú analýzu SQL, a ja tam veľmi úzko spolupracujem s Deb Says, ktorý je projektom. manažérka v ich tíme dátových nástrojov a zistila, že keď si pýtatelia osvojia Alation, prijmú katalóg, vidia dvojnásobnú rýchlosť zápisu nových dopytov do databázy.

Takže to sú skutočné výsledky, sú to ľudia, ktorí skutočne používajú katalóg vo svojej organizácii, a ja vás chcem sprevádzať tým, čo je potrebné na zostavenie. Ako sa v spoločnosti vytvorí katalóg a možno najdôležitejšie je povedať, že sa to deje automaticky, takže Dez hovoril o systémoch, o systémoch a presne to robí moderný dátový katalóg. Nainštalujú Alation do svojho dátového centra a potom ho pripoja k rôznym zdrojom metaúdajov v ich dátovom prostredí. Trochu sa sústredím na databázy a nástroje BI - z týchto dvoch budeme extrahovať technické metaúdaje, v podstate o tom, čo existuje. Správne, aké tabuľky? Aké správy? Čo sú definície správy? Takto extrahujú tieto technické metaúdaje a automaticky sa vytvorí stránka katalógu pre každý objekt vo vnútri týchto systémov, a potom tiež extrahujú a navrstvia navrch týchto technických metaúdajov, navrstvia navrch údaje o použití. To sa deje predovšetkým čítaním protokolov dopytov z databázy, čo je skutočne zaujímavý zdroj informácií. Takže kedykoľvek analytik píše dotaz, kedykoľvek nástroj na vytváranie prehľadov, či už ide o domáce pestovanie alebo mimo regálu, či nástroj na tvorbu prehľadov spustí dotaz s cieľom aktualizovať informačný panel, keď aplikácia spustí dotaz na vloženie údajov, na ktorých bude pracovať množina údajov - všetky tieto veci sú zachytené v protokoloch databázových dopytov. Či už máte katalóg alebo nie, sú zachytené v protokole dotazov s databázou. Čo môže katalóg údajov urobiť, a najmä to, čo môže katalóg Alations urobiť, je prečítať si tieto denníky, spýtať sa na ne vo vnútri nich a na základe týchto protokolov vytvoriť skutočne zaujímavý graf použitia a my ich uvádzame do hry, aby sme informovali budúcich používateľov. údajov o tom, ako ich používali používatelia v minulosti.

Takže všetky tieto vedomosti spájame do katalógu a len preto, aby sa to stalo skutočnosťou, jedná sa o integrácie, ktoré sú už nasadené u zákazníkov, takže sme videli Oracle, Teradata, Redshift, Vertica a veľa ďalších relačné databázy. Vo svete Hadoop existuje škála SQL na Hadoop, druh relačných obchodov, meta obchody na vrchole systému súborov Hadoop, Impala, Tez, Presto a Hive, sme tiež videli úspech so súkromnými poskytovateľmi cloudu Hadoop ako Altiscale a my boli tiež schopní pripojiť sa k serverom Tableau, serverom MicroStrategy a indexovať dashboardy tam, ako aj integráciu s nástrojmi mapovania údajov, ako je Plotly.

Preto sa pripájame ku všetkým týmto systémom, pripájame tieto systémy k zákazníkom, vtiahli sme technické metaúdaje, vtiahli sme údaje o používaní a automaticky sme automaticky pripravili katalóg údajov, ale takto sme centralizácia vedomostí, ale iba centralizácia vecí do dátového katalógu, sama osebe neposkytuje tie skutočne úžasné zvyšovania produktivity, o ktorých sme hovorili prostredníctvom eBay, námestia a podielu na trhu. Aby sme to mohli urobiť, musíme skutočne zmeniť spôsob, akým uvažujeme o poskytovaní poznatkov analytikom. Jednou z otázok, na ktorú sa chcú pripraviť, bolo: „Aký vplyv má katalóg na analytický postup?“

To je to, čo trávime celý deň premýšľaním, a aby sme mohli hovoriť o tejto zmene myslenia, modelu push-versus pull, chcel som urobiť rýchlu analógiu s tým, aký bol svet pred a po prečítaní na Kindle. Takže je to len skúsenosť, ktorú niektorí z vás môžu mať, keď čítate fyzickú knihu, narazíte na slovo, nie ste si istí, či dobre viete definíciu toho slova, môžete ju uhádnuť z kona, nie tak pravdepodobné, že idú vstať z gauča, prejsť do knižnice, nájsť si slovník, poprášiť ho a otočiť na správne miesto v abecednom zozname slov, aby si sa ubezpečil, že áno, mali ste túto definíciu v poriadku a viete, jej nuansy. Takže sa to naozaj nestane. Takže si kúpite aplikáciu Kindle a začnete tam čítať knihy a uvidíte slovo, o ktorom si nie ste úplne istí, a dotknete sa ho. Zrazu, práve na tej istej obrazovke, je definícia slovníka v slovníku, so všetkými jeho nuansami, rôznymi príkladmi použitia a trochu prejdením prstom, a získate článok z Wikipedia o tejto téme, prejdením prstom znova, získate prekladateľský nástroj, ktorý ho dokáže preložiť do iných jazykov alebo z iných jazykov, a zrazu je vaša znalosť jazyka oveľa bohatšia a iba niekoľkokrát sa stáva ohromujúcou v porovnaní s tým, kedy ste museli ísť a vytiahnite tento zdroj pre seba.

A tak budem tvrdiť, že pracovný postup pre analytika a spôsob, akým sa analytik bude zaoberať dokumentáciou o údajoch, je v skutočnosti veľmi podobný tomu, ako čitateľ bude interagovať so slovníkom, či už fyzickým, alebo hoci Kindle, a tak to, čo sme skutočne videli, ako sa zvýšila táto produktivita, nie je šírenie katalógu, ale jeho prepojenie s pracovným tokom analytika, a tak ma požiadali, aby som tu urobil demo, a chcem aby bola táto prezentácia zameraná. Ale ja chcem iba nastaviť demo na demo. Keď premýšľame o presúvaní znalostí o údajoch k používateľom, keď ich potrebujú, myslíme si, že je to správne miesto, kde trávia svoj čas a kde robia analýzu, je dotazovací nástroj SQL. Miesto, kde môžete písať a spúšťať dotazy SQL. A tak sme jeden postavili, a postavili sme ho, a vec, ktorá sa v ňom skutočne líši od ostatných nástrojov na dotazovanie, je jeho hlboká integrácia s katalógom údajov.

Náš vyhľadávací nástroj sa preto nazýva Alation Compose. Je to webový dotazovací nástroj a ja vám to za sekundu ukážem. Nástroj na vyhľadávanie na webe, ktorý funguje vo všetkých tých databázových logách, ktoré ste videli na predchádzajúcej snímke. Čo sa pokúsim vyskúšať, je najmä to, ako katalógové informácie prichádzajú k používateľom. A to prostredníctvom týchto troch rôznych spôsobov. Uskutočňuje to prostredníctvom zásahov a to je prípad, keď niekto, kto je správcom údajov alebo správcom údajov alebo akýmkoľvek správcom nejakého spôsobu alebo správcom, môže povedať: „Chcem nejaký zásah do poznámky alebo varovania v workflow a uistite sa, že je doručená používateľom v správnom čase. “To je zásah a dobre to dokazujte.

Inteligentné návrhy je spôsob, ktorým nástroj využíva všetky svoje agregované znalosti katalógu na navrhovanie objektov a častí dotazu pri jeho písaní. Najdôležitejšou vecou, ktorú je potrebné vedieť, je to, že na to skutočne využíva protokol dotazov, navrhuje veci založené na použití a tiež na nájdenie dokonca aj tých častí otázok, ktoré boli predtým napísané. A dobre to ukážte.

A potom ukážky. Ukážky sú, ako píšete názov objektu, ukážeme vám všetko, čo katalóg vie, alebo aspoň najdôležitejšie veci, ktoré katalóg o tomto objekte vie. Takže vzorky údajov, ktoré ich predtým používali, logické meno a popis tohto objektu, vás pri písaní prídu na všetko, bez toho, aby ste sa museli pýtať.

Takže bez ďalšieho rozprávania sa dostanem k demonštrácii a ja len počkám, kým sa objaví. To, čo ti ukážem, je dotazovací nástroj. Je to špecializované rozhranie SQL na písanie. Je to v určitom zmysle samostatné rozhranie od katalógu. Dez a Robin hovorili o katalógu a Im trochu preskočil cez rozhranie katalógu priamo k tomu, ako sa to priamo prejavilo pri obsluhe pracovného toku.

Práve tu ukazujem miesto, kde môžem napísať SQL, a dole uvidíte, že sa objavujú nejaké informácie o objektoch, ktoré odkazovali. Takže len začnem písať dotaz a keď sa dostanem k jednému z týchto zásahov, zastavím sa. Takže napíšem „select“ a ja chcem rok. Chcem meno. A ja sa pozriem na nejaké údaje o mzdách. Toto je súbor údajov o vzdelávaní. Má informácie o vysokých školách a Im pri pohľade na priemerný plat fakulty to je v jednej z týchto tabuliek.

Takže som vlastne napísal slovo „plat“. Nie je to tak presne v názve stĺpca. Na vytváranie návrhov používame logické aj fyzické metadáta. A to, čo chcem zdôrazniť, je toto žlté pole, ktoré sa tu objavuje. V tomto stĺpci je uvedené upozornenie. Nehľadal som to, nebral som triedu o tom, ako správne používať tieto údaje. Prišlo mi to a je to varovanie pred dohodou o mlčanlivosti, ktorá sa týka týchto údajov. Teda existuje niekoľko pravidiel zverejňovania. Ak budem zisťovať tieto údaje, vyberiem údaje z tejto tabuľky, mal by som byť opatrný pri ich zverejňovaní. Takže tu máte politiku riadenia. Ak viem o tom v čase, keď sa na tieto údaje pozerám, prináša určité problémy s dodržiavaním pravidiel, ktoré uľahčujú dodržiavanie týchto pravidiel.

Tak som to prišiel ku mne a potom som sa tiež pozrel na školné. A tu vidíme ukážky vstupujúce do hry. V tomto stĺpci výučby vidím - existuje stĺpec výučby v tabuľke inštitúcií a vidím jeho profil. Alácia ide a vytiahne vzorové údaje z tabuliek, av tomto prípade mi to ukazuje niečo zaujímavé. Ukazuje mi rozdelenie hodnôt a ukazuje mi, že nulová hodnota sa vo vzorke prejavila 45-krát a viac ako ktorákoľvek iná hodnota. Mám teda nejaký zmysel, že by nám mohli chýbať nejaké údaje.

Ak som pokročilý analytik, môže to byť už súčasťou môjho pracovného postupu. Najmä ak som obzvlášť dôkladný, kde by som urobil veľa profilovacích otázok v predstihu. Kedykoľvek sa blížim k novému údaju, vždy premýšľam o tom, čo je naše pokrytie údajov. Ale ak som nový analytik údajov, ak som nový v tejto množine údajov, mohol by som predpokladať, že ak existuje stĺpec, vyplní sa po celú dobu. Alebo by som mohol predpokladať, že ak nie je vyplnený, nie je nula, je null alebo niečo také. Ale v tomto prípade máme veľa núl, a ak by som urobil priemer, pravdepodobne by sa mýlili, keby som len predpokladal, že tieto nula boli v skutočnosti nula namiesto chýbajúcich údajov.

Ale Alation tým, že uvediete túto ukážku do svojho pracovného toku, druh vás požiada, aby ste sa na tieto informácie pozreli, a dáva tak istému druhu začínajúcich analytikov šancu vidieť, že je tu niečo, čo by si o týchto údajoch malo všimnúť. Máme teda tento náhľad.

Ďalšia vec, ktorú budem robiť, je, že sa pokúsim zistiť, z ktorých tabuliek je možné získať tieto informácie. Takže tu vidíme inteligentné návrhy. Bolo to stále, ale najmä tu, ani som nenapísal nič iné ako to, aby mi naznačil, ktoré tabuľky by som mohol chcieť použiť pre tento dotaz. Najdôležitejšou vecou o tom je, že využíva štatistiky používania. Takže v prostredí, ako je napríklad eBay, kde máte stovky tisíc tabuliek v jednej databáze, je k dispozícii nástroj, ktorý dokáže zasiahnuť pšenicu z plev, a pomocou týchto štatistík využitia je skutočne dôležité návrhy za niečo stojí.

Takže to navrhne túto tabuľku. Keď sa pozriem na ukážku, v skutočnosti zvýrazníme tri stĺpce, ktoré som už uviedol vo svojom dotaze. Takže viem, že to má tri, ale nemá meno. Musím získať meno, takže sa chystám pripojiť. Keď sa pripojím, teraz mám opäť tieto ukážky, ktoré mi pomôžu nájsť, kde je tabuľka s menom. Takže vidím, že tento má pekne formátované a správne písané veľké písmeno. Zdá sa, že pre každú inštitúciu je jeden riadok s názvom, takže to chcem chytiť a teraz potrebujem podmienku pripojenia.

A to, čo Alation robí, sa opäť obracia na protokoly dotazov, keď videl predchádzajúce časy, keď sa tieto dve tabuľky spojili, a navrhuje rôzne spôsoby, ako sa k nim pripojiť. Opäť je tu nejaký zásah. Ak sa pozriem na jeden z nich, dostal varovanie, ktoré mi ukazuje, že by sa to malo použiť iba na súhrnnú analýzu. Pravdepodobne to spôsobí nesprávnu vec, ak sa snažíte niečo urobiť prostredníctvom inštitúcie podľa inštitúcie. Zatiaľ čo táto s OPE ID je schválená ako správny spôsob spojenia týchto dvoch tabuliek, ak chcete údaje na univerzitnej úrovni. Robím to a je to krátky dotaz, ale svoj dotaz som napísal bez toho, aby som musel mať nevyhnutne prehľad o tom, aké údaje sú. Nikdy som sa nepozrel na ER diagram tohto súboru údajov, ale o týchto údajoch viem už dosť, pretože mi prichádzajú príslušné informácie.

Toto sú tri druhy spôsobov, ako môže katalóg prostredníctvom integrovaného nástroja na dotazovanie priamo ovplyvniť pracovný tok pri písaní dopytov. Jednou z ďalších výhod integrovania dotazovacieho nástroja do katalógu je však to, že po dokončení dotazu a jeho uložení môžem zadať názov „Inštitúcia - školné a mzda na fakulte“ a potom tu mám tlačidlo, ktoré umožňuje mi to iba zverejniť v katalógu. Je pre mňa veľmi ľahké nakŕmiť to. Aj keď ho nezverejňujem, jeho zachytenie je súčasťou protokolu dotazov, ale keď ho zverejníme, v skutočnosti sa stáva súčasťou spôsobu, akým centralizované miesto, kde žijú všetky vedomosti o údajoch.

Takže ak kliknem na položku Vyhľadať všetky dopyty v Alation, budem prijatý - a tu uvidíte niekoľko ďalších rozhraní katalógu - Som prijatý na vyhľadávanie vyhradených dotazov, ktoré mi ukazuje spôsob, ako nájsť otázky v celej organizácii. A vidíte, že môj novo zverejnený dotaz je na vrchu. A niektorí si tu môžu všimnúť, keď zachytávame otázky, tiež zachytávame autorov a tento vzťah medzi mnou ako autorom a týmito dátovými objektmi, o ktorých viem niečo teraz viem, nadviazal. A som etablovaný ako expert na tento dotaz a na tieto dátové objekty. Je to naozaj užitočné, keď sa ľudia musia ísť učiť o údajoch, potom môžu ísť nájsť tú pravú osobu, o ktorej by sa mali dozvedieť. A ak som skutočne nový v údajoch, či už som pokročilý analytik - ako pokročilý analytik, mohol by som sa na to pozrieť a vidieť veľa príkladov, ktoré by mi pomohli začať s novým súborom údajov. Ako niekto, kto sa nemusí cítiť veľmi dôvtipný s SQL, môžem nájsť vopred pripravené otázky, ktoré sú hláseniami, ktoré môžem využiť.

Tu je jeden z Phil Mazanett o strednej SAT skóre. Kliknite na toto a dostanem nejakú stránku katalógu pre samotný dotaz. Hovorí o článku, ktorý bol napísaný a ktorý odkazuje na tento dotaz, takže je tu nejaká dokumentácia, ktorú si môžem prečítať, ak sa chcem naučiť, ako ju používať. A môžem ho otvoriť v dotazovacom nástroji kliknutím na tlačidlo Napísať a môžem ho spustiť aj tu bez toho, aby som ho upravoval. A vlastne uvidíte trochu našich ľahkých reportovacích schopností, kde keď píšete dotaz, môžete upustiť od premennej šablóny, ako je táto, a vytvára jednoduchý spôsob, ako vytvoriť formulár na vykonanie dotazu na základe pár parametrov.

To je to, čo mám pre ukážku. Prejdem späť na snímky.Aby sme to rekapitulovali, ukázali sme, ako môže správca, správca údajov, zasiahnuť prostredníctvom upozornení na objekty, ktoré sa zobrazujú v dotazovacom nástroji, ako Alation využíva svoje znalosti o používaní dátových objektov na vytváranie inteligentných návrhov, ako prináša v profilovaní a iných tipoch na zlepšenie pracovných postupov analytikov, keď sa dotýkajú konkrétnych objektov, a ako sa tento druh informačných kanálov vracia späť do katalógu pri písaní nových dopytov.

Zrejme som hovorcom v mene spoločnosti. Budem hovoriť pekné veci o katalógoch údajov. Ak chcete počuť priamo od jedného z našich zákazníkov, Kristie Allen v spoločnosti Safeway vedie tím analytikov a má skutočne skvelý príbeh o čase, keď musela skutočne poraziť hodiny, aby mohla uskutočniť marketingový experiment, a ako celá jej Tím použil Alation na spoluprácu a obrat v tomto projekte. Ak chcete skontrolovať tento príbeh, môžete sledovať tento bit.ly odkaz, alebo ak sa chcete dozvedieť niečo o tom, ako Alation môže priniesť katalóg údajov do vašej organizácie, radi vám zostavíme prispôsobené demo. Mnohokrat dakujem.

Rebecca Jozwiak: Ďakujem veľmi pekne, Davide. Som si istý, že Dez a Robin majú pár otázok, než sa obrátim na otázky a odpovede pre divákov. Dez, chceš ísť prvý?

Dez Blanchfield: Absolútne. Páči sa mi myšlienka tohto konceptu publikovaných dopytov a jeho spätné prepojenie so zdrojom autora. Bol som dlhoročným majstrom tejto myšlienky interného obchodu s aplikáciami a myslím si, že je to skutočne skvelý základ, na ktorom sa dá stavať.

Prišiel som sa trochu oboznámiť s niektorými organizáciami, ktoré vidíte, ako to robia, a s niektorými úspešnými príbehmi, ktoré mohli mať pri tejto celej ceste nielen využitia vášho nástroja a platformy na zistenie údajov, ale aj potom premieňajú svoje vnútorné kultúrne a behaviorálne vlastnosti. Teraz majú tento druh interného obchodu s aplikáciami, kde si len sťahujete, koncept, v ktorom ho nielen nájdu, ale v skutočnosti môžu začať rozvíjať malé komunity s držiteľmi týchto znalostí.

David Crawford: Áno, myslím, že sme boli prekvapení. Veríme v hodnotu zdieľania otázok, a to tak z mojej minulosti ako produktového manažéra v spoločnosti Adtech, ako aj od všetkých zákazníkov, s ktorými sme sa rozprávali, ale stále ma prekvapilo, ako často je jednou z prvých vecí, o ktorej zákazníci hovoria ako hodnotu, ktorú dostanú z Alácie.

Uskutočňoval som nejaké užívateľské testovanie dotazovacieho nástroja u jedného z našich zákazníkov s názvom Invoice2go a mali produktového manažéra, ktorý bol relatívne nový, a povedali - vlastne mi povedal, že mi počas užívateľského testu neprišiel, „vlastne by som nepísal SQL vôbec, okrem toho, že to bolo ľahké pomocou Alation. “A samozrejme, ako PM, tak trochu idem,„ Čo tým myslíš, ako sme to urobili? “A povedal:„ No, naozaj je to len preto, že som sa môžem prihlásiť a vidím všetky tieto existujúce otázky. “Začať s prázdnou tabuľkou s SQL je neuveriteľne ťažké urobiť, ale upraviť existujúci dotaz, kde môžete vidieť výsledok, ktorý je uvedený, a môžete povedať:„ Och „Potrebujem iba tento stĺpec navyše“ alebo „Musím ho filtrovať do určitého rozsahu dátumov“, čo je omnoho jednoduchšie.

Weve videl druh týchto pomocných rolí, ako sú produktoví manažéri, možno ľudia v obchodných operáciách, ktorí sa začínajú zdvíhať a ktorí sa vždy chceli naučiť SQL a začať si ho zbierať pomocou tohto katalógu. Weve tiež videl, že mnoho spoločností sa pokúsilo urobiť akýsi otvorený zdroj. Snažil som sa postaviť tieto veci interne, kde sledujú otázky a sprístupňujú ich, a existuje niekoľko skutočne zložitých výziev, aby boli užitočné. má interný nástroj, ktorý nazývajú HiPal a ktorý zachytil všetky otázky napísané na úli, ale zistíte, že ak nezaťahujete používateľov správnym spôsobom, jednoducho skončíte s veľmi dlhým zoznamom. vybraných príkazov. A ako používateľ, ktorý sa snaží zistiť, či je dotaz pre mňa užitočný alebo ak je jeho nejaký dobrý, ak sa len pozriem na dlhý zoznam vybratých vyhlásení, bude mi trvať oveľa dlhšie, kým tam niečo získam z hodnoty, než ako začínajúc od nuly. Veľmi starostlivo sme premýšľali o tom, ako vytvoriť katalóg dopytov, ktorý prinesie správne veci na front a poskytne ho užitočným spôsobom.

Dez Blanchfield: Myslím si, že všetci sme touto cestou prešli od veľmi mladého veku do dospelosti mnohými spôsobmi. Veľa technológií. Ja osobne som prešiel tou istou pravou vecou, podobne, naučil som sa rezať kód. Prešiel som časopismi a potom knihami a študoval som na určitú úroveň, potom som musel ísť a skutočne sa do toho naučiť.

Ale neúmyselne som zistil, že aj keď som išiel od výučby seba a čítania časopisov a čítania kníh a sekania iných programov pre ľudí a odchodu na kurzy, stále som sa učil robiť kurzy tak, ako som hovoril len s ostatnými. ľudia, ktorí mali nejaké skúsenosti. A myslím si, že je to zaujímavý objav, ktorý teraz, keď to prinesiete do analýzy údajov, v podstate videl tú istú paralelu, že ľudské bytosti sú vždy celkom inteligentné.

Ďalšou vecou, ktorú naozaj chcem pochopiť, je, že na veľmi vysokej úrovni sa mnoho organizácií pýta: „Ako dlho trvá, kým sa dostaneme k tomuto bodu?“ Aký je časový bod zvratu, keď ľudia dostanú vašu platformu? nainštalované a začali objavovať typy nástrojov? Ako rýchlo sú ľudia tak trochu videní, že sa táto vec zmení na skutočne okamžitý „a-ha“ okamih, keď si uvedomia, že sa už vôbec netrápia NI, pretože je to tam, ale teraz vlastne menia spôsob podnikania? A objavili stratené umenie a očakávajú, že s tým dokážu urobiť niečo naozaj zábavné.

David Crawford: Áno, trochu sa toho dotknem. Myslím si, že keď sa inštalujeme, jedna z pekných vecí, jedna z vecí, ktoré sa ľuďom páčia o katalógu, ktorý je priamo napojený na dátové systémy, je to, že nezačínate prázdne, kde ich musíte vyplniť na stránke str. A to platí pre predchádzajúce dátové riešenia, kde by ste začínali prázdnym nástrojom a musíte začať vytvárať stránku pre všetko, čo chcete dokumentovať.

Keďže dokumentujeme toľko vecí automaticky extrahovaním metaúdajov, v zásade do niekoľkých dní od nainštalovania softvéru, môžete si v nástroji vytvoriť obraz svojho dátového prostredia, ktoré je v ňom najmenej 80 percent. A potom si myslím, že keď ľudia začnú písať otázky pomocou tohto nástroja, automaticky sa ukladajú späť do katalógu, a tak sa začnú tiež zobrazovať.

Nechcem byť príliš horlivý pri jeho uvádzaní. Myslím si, že dva týždne sú celkom dobrým konzervatívnym odhadom na mesiac. Dva týždne až mesiac, konzervatívny odhad skutočného obratu a pocitu, že z toho vyťažujete, ako keby ste začínali zdieľať nejaké vedomosti a mohli tam ísť a zistiť veci o svojich údajoch.

Dez Blanchfield: Je to skutočne úžasné, keď na to myslíte. Skutočnosť, že niektoré z veľkých dátových platforiem, ktoré efektívne indexujete a katalogizujete, bude niekedy trvať, kým sa implementujú a zavedú a postavia sa správne.

Posledná otázka, ktorú som pre vás dostal predtým, ako som ju odovzdal Robinovi Bloorovi, sú konektory. Jedna z vecí, ktorá na mňa okamžite vyskočí, je, že ste celú výzvu vyriešili. Takže existuje pár otázok len veľmi rýchlo. Po prvé, ako rýchlo sa implementujú konektory? Je zrejmé, že začnete s najväčšou platformou, ako sú Oracles a Teradatas atď. A DB2. Ale ako pravidelne vidíte nové konektory a aký čas to zaberie? Predstavujem si, že pre nich máte štandardný rámec. A ako hlboko do nich chodíš? Napríklad Oracles a IBM na svete a dokonca aj Tereadata, a potom niektoré z najpopulárnejších neskorých open-source platforiem. Pracujú priamo s vami? Objavujete to sami? Musíš mať na týchto platformách dôverné vedomosti?

Ako to vyzerá, ako by ste vyvinuli konektor a ako hlboko sa zapojíte do týchto partnerstiev, aby ste zaistili, že tieto konektory objavia všetko, čo je možné?

David Crawford: Áno, je to skvelá otázka. Myslím si, že z väčšej časti môžeme vyvinúť konektory. Určite sme to urobili, keď sme boli mladší startup a nemali sme zákazníkov. Môžeme určite rozvíjať spojenia bez potreby akéhokoľvek vnútorného prístupu. Nikdy nedostaneme žiadny špeciálny prístup k dátovým systémom, ktoré nie sú verejne dostupné, a často bez potreby akýchkoľvek dôverných informácií. Využívame výhody metaúdajových služieb dostupných samotnými dátovými systémami. Často s nimi môže byť dosť zložité a ťažko s nimi pracovať. Znám najmä SQL Server, spôsob, akým spravujú denník dotazov, existuje niekoľko rôznych konfigurácií a je to niečo, na čom skutočne musíte pracovať. Aby ste to správne nastavili, musíte pochopiť nuansy a gombíky a číselníky a to je niečo, na čom pracujeme so zákazníkmi, keďže sme to už niekoľkokrát urobili.

Ale do určitej miery je to druh verejných API, ktoré sú k dispozícii, alebo verejné rozhrania, ktoré sú k dispozícii a ktoré využívame. Máme partnerstvá s niekoľkými z týchto spoločností, ktoré sú väčšinou dôvodom na certifikáciu, aby sa cítili pohodlne, keď tvrdia, že pracujeme, a tiež nám môžu poskytnúť zdroje na testovanie, niekedy aj skorý prístup k platforme, ktorá vyjde, aby sa ubezpečila, že pracujeme na nových verziách.

Aby som zmenil nové spojenie, povedal by som znova, snažiac sa byť konzervatívny, povedzme šesť týždňov až dva mesiace. Závisí to od toho, ako je to podobné. Takže niektoré z Postgreho diel vyzerajú veľmi podobne ako Redshift. Redshift a Vertica zdieľajú veľa detailov. Takže môžeme tieto veci využiť. Ale áno, šesť týždňov až dva mesiace by bolo fér.

Máme tiež API, takže - myslíme aj na Aláciu ako na metaúdajovú platformu, takže ak nie sú pre nás k dispozícii žiadne ďalšie informácie, ktoré by nás mohli osloviť a automaticky uchopiť, existujú spôsoby, ako môžete sami napísať konektor a zatlačiť ho do nášho systému tak, že všetko sa centralizuje do jedného vyhľadávacieho nástroja.

Dez Blanchfield: Fantastické. Oceňujem, že. Tak to išli odovzdať Robinovi, pretože som si istý, že má aj množstvo otázok. Robin?

Rebecca Jozwiak: Robin môže byť stlmený.

Dez Blanchfield: Dostal si sa na mute.

Robin Bloor: Áno, správne. Prepáč, stlmil som sa. Keď to implementujete, aký je postup? Som trochu zvedavý, pretože na mnohých miestach môže byť veľa údajov. Ako to teda funguje?

David Crawford: Áno iste. Vstúpime, najprv do procesu IT, ktorý zaisťuje zabezpečenie našich serverov, zabezpečenie dostupnosti sieťových pripojení, otvorenie portov, aby sme mohli skutočne pristupovať k systémom. Všetci často vedia, s ktorými systémami chcú začať. Znalosť vnútra dátového systému, ktorý - a niekedy im vlastne pomôžeme. Pomôžte im ísť urobiť úvodný pohľad na ich denník dotazov, aby pochopili, kto používa to, čo a koľko používateľov má v systéme. Pomôžte tiež zistiť, kde - často, ak majú stovky alebo tisíce ľudí, ktorí sa môžu prihlasovať do databáz, v skutočnosti nevedia, kde sa prihlasujú, takže z protokolov dotazov môžeme zistiť, koľko jedinečných používateľských účtov je skutočne ste sa prihlásili a vykonávali dotazy tu asi za mesiac.

Môžeme to využiť, ale často len na tie najdôležitejšie. Necháme ich nastaviť a potom je tu proces povedia: „Uprednostňujme.“ Existuje celý rad aktivít, ktoré sa môžu stať súbežne. Zamerala by som sa na školenie týkajúce sa používania dotazovacieho nástroja. Keď ľudia začnú používať dotazovací nástroj, v prvom rade veľa ľudí zbožňuje skutočnosť, že je to iba jediné rozhranie so všetkými ich rôznymi systémami. Milujú tiež skutočnosť, že jeho webová aplikácia nezahŕňa žiadne inštalácie, ak si to neželá. Z hľadiska zabezpečenia majú radi určitý druh vstupného bodu, zo sieťového hľadiska, medzi akýmkoľvek druhom podnikovej siete IT a dátovým centrom, v ktorom žijú zdroje produkčných údajov. Preto nastavia Alation ako dotazovací nástroj a začnú používať Compose ako prístupový bod pre všetky tieto systémy.

Akonáhle sa to stane, tým, na čo sa zameriavame, je školenie, porozumieť tomu, aké sú niektoré z rozdielov medzi webovým alebo serverovým dotazovacím nástrojom v porovnaní s tými, ktoré máte na pracovnej ploche, a niektorými nuansami ich použitia. Zároveň sa snažíme identifikovať najcennejšie údaje, opäť využiť informácie z denníka dopytov a povedať: „Hej, možno by si mal ísť a pomôcť ľuďom porozumieť im. Umožňuje začať publikovať reprezentatívne otázky o týchto tabuľkách. “To je niekedy najúčinnejší spôsob, ako veľmi rýchlo prinútiť ľudí, aby sa točili. Pozrime sa na svoju históriu dopytov, zverejnite tieto veci tak, aby sa zobrazovali ako prvé dopyty. Keď ľudia pozerajú na stránku tabuľky, môžu vidieť všetky otázky, ktoré sa tejto tabuľky dotkli, a môžu začať odtiaľ. A potom môžete začať pridávať názvy a popisy k týmto objektom, aby sa dali ľahšie nájsť a vyhľadať, aby ste vedeli niektoré nuansy, ako ich používať.

Dbáme na to, aby sme sa dôkladne pozreli do denníka dotazov, aby sme mohli vygenerovať rodokmeň. Jednou z vecí, ktorú robíme, je, že sa pozrieme do denníka dotazov v čase, keď sa údaje presúvajú z jednej tabuľky do druhej, a to nám umožňuje klásť jednu z najčastejšie kladených otázok o tabuľke údajov, odkiaľ to prišlo? Ako tomu môžem veriť? To, čo môžeme ukázať, je nielen to, z ktorých ďalších tabuliek pochádza, ale ako sa transformoval. Opäť je to tak trochu poháňané protokolom dotazov.

Zabezpečujeme preto, aby boli tieto veci nastavené a dostali do systému počet riadkov a boli zamerané na najcennejšie a najviac využívané kusy metaúdajov, ktoré môžeme zistiť na stránkach tabuľky, takže keď hľadáte, nájdete niečo užitočné.

Robin Bloor: Poriadku. Ďalšia otázka - je tu veľa otázok od publika, takže tu nechcem zaberať príliš veľa času - ďalšou otázkou, na ktorú takúto myseľ príde, sú iba body bolesti. Mnoho softvéru bolo zakúpené, pretože ľudia tak či onak majú s niečím problémy. Čo je to bod spoločnej bolesti, ktorý vedie ľudí k Alácii?

David Crawford: Jo. Myslím, že ich je niekoľko, ale myslím si, že jedným z tých, ktoré veľmi často počujeme, je analytik na palube. „Budem musieť v blízkom období najať 10, 20, 30 ľudí, ktorí budú musieť z týchto údajov získať nové informácie, ako sa dostanú na rýchlosť?“ Takže nastupovanie analytikov je niečo, s čím sa určite stretneme. Taktiež iba odbremeňuje analytikov od toho, aby trávili všetok svoj čas odpovedaním na otázky iných ľudí o údajoch. To je tiež veľmi časté. A obaja sú v podstate problémy so vzdelávaním.

A potom by som povedal ďalšie miesto, ktoré vidíme, ako ľudia prijímajú Alation, keď chcú vytvoriť úplne nové dátové prostredie, v ktorom by niekto pracoval. Chcú ho interne propagovať a predávať, aby ho ľudia mohli využívať. Potom sa Alation stáva front-endom tohto nového analytického prostredia, je veľmi príťažlivé. Má dokumentáciu, má jediný úvod do - jedného miesta prístupu do systémov, a tak je to ďalšie miesto, kam k nám ľudia prídu.

Robin Bloor: Dobre, pošlem ťa do Rebeccy, pretože publikum sa ti snaží dostať.

Rebecca Jozwiak: Áno, máme tu veľa skutočne dobrých otázok pre divákov. A David, tento bol pre vás špeciálne určený. Je to od niekoho, kto má zrejme nejaké skúsenosti s ľuďmi, akým spôsobom zneužíva otázky, a tak hovorí, že čím viac oprávňujeme používateľov, tým ťažšie je riadiť zodpovedné využívanie výpočtových zdrojov. Môžete sa teda brániť proti šíreniu zavádzajúcich, ale obvyklých dopytových fráz?

David Crawford: Áno, vidím túto otázku. Je to skvelá otázka, ktorú dostávame dosť často. Bolest som videl sám v predchádzajúcich spoločnostiach, kde musíte trénovať používateľov. Napríklad: „Toto je tabuľka denníkov, jej záznamy sa vracajú už roky. Ak chcete do tejto tabuľky napísať dotaz, musíte sa skutočne obmedziť podľa dátumu. “Napríklad to je školenie, ktoré som absolvoval v predchádzajúcej spoločnosti predtým, ako mi bol poskytnutý prístup k databáze.

Máme niekoľko spôsobov, ako sa to snažiť vyriešiť. Povedal by som, že si myslím, že údaje denníka dopytov sú skutočne jedinečne cenné na ich riešenie. Poskytuje ďalšie informácie v porovnaní s tým, čo databáza robí interne pomocou svojho plánovača dotazov. A čo robíme, je jeden z tých zásahov - máme manuálne zásahy, ktoré som ukázal, a to je užitočné, nie? Napríklad pri konkrétnom pripojení môžete povedať, „Umožňuje to zastarať“. Keď sa ukáže inteligentný návrh, bude mať veľkú červenú vlajku. Je to jeden zo spôsobov, ako sa dostať k ľuďom.

Ďalšou vecou, ktorú robíme, je automatizácia zásahov v čase vykonávania. Skôr ako spustíme dotaz, v skutočnosti použijeme strom analyzovania dotazu, obsahuje to určitý filter alebo pár ďalších vecí, ktoré tam tiež robíme. Ale jeden z najcennejších a najjednoduchší na vysvetlenie je, obsahuje filter? Podobne ako v tomto príklade, ktorý som práve uviedol, aj táto denníková tabuľka, ak ju chcete zadať, musí mať rozsah dátumov, na stránke tabuľky môžete určiť, že chcete tento filter rozsahu dátumov poveriť. Ak sa niekto pokúsi spustiť dotaz, ktorý neobsahuje tento filter, v skutočnosti ich zastaví s veľkým upozornením a na otázku „Mali by ste pravdepodobne pridať nejaký SQL, ktorý vyzerá takto, do svojho dotazu.“ Môžu pokračovať, ak chcú. , Nebudú v skutočnosti úplne zakázať ich použitie - to je tiež dotaz, jeho dostal, na konci dňa, spustiť otázky. Pred nimi sme však položili dosť veľkú prekážku a dáme im návrh, konkrétny použiteľný návrh na úpravu dotazu, aby sa zlepšil ich výkon.

V niektorých prípadoch to tiež robíme automaticky, opäť sledovaním protokolu dotazov. Ak zistíme, že niektoré skutočne veľké percento dopytov v tejto tabuľke využíva konkrétny filter alebo konkrétnu klauzulu o pripojení, potom to v skutočnosti vyskočí. Dobre to povýšte na zásah. V skutočnosti sa mi to stalo na internom súbore údajov. Máme údaje o zákazníkoch a máme užívateľské ID, ale užívateľské ID je nastavené, od jeho druhu - máme užívateľské ID u každého zákazníka. Nie je jedinečný, takže ho musíte spárovať s klientskym ID, aby ste získali jedinečný kľúč na pripojenie.A písal som dotaz a pokúsil som sa niečo analyzovať a objavil sa a povedal: „Hej, zdá sa, že všetci ostatní spájajú tieto tabuľky s ID klienta aj ID používateľa. Naozaj to nechcete robiť? “A v skutočnosti ma to zastavilo v robení nesprávnej analýzy. Pracuje tak pre presnosť analýzy, ako aj pre výkon. Takže to je spôsob, akým tento problém riešime.

Rebecca Jozwiak: Zdá sa mi, že je to efektívne. Povedali ste, že nevyhnutne nebránite ľuďom v zabíjaní zdrojov, ale nejakým spôsobom ich učíte, že to, čo robia, nemusí byť najlepšie, nie?

David Crawford: Vždy predpokladáme, že používatelia nie sú škodliví - dajte im najlepšie úmysly - a týmto spôsobom sa snažíme byť celkom otvorení.

Rebecca Jozwiak: Poriadku. Tu je ďalšia otázka: „Aký je rozdiel medzi manažérom katalógu, napríklad s riešením a nástrojom MDM? Alebo sa v skutočnosti spolieha na inú istinu rozšírením výberu dopytových tabuliek, zatiaľ čo MDM by to urobil automaticky, ale s rovnakým základným princípom zhromažďovania metadát. ““

David Crawford: Áno, myslím si, že keď sa pozriem na tradičné riešenia MDM, hlavným rozdielom je filozofické riešenie. Je to všetko o tom, kto je používateľ. Rovnako ako som povedal na začiatku mojej prezentácie, Alation, myslím si, že keď sme boli založení, boli sme založení s cieľom umožniť analytikom produkovať viac štatistík, rýchlejšie ich produkovať, presnejšie porozumieť ich informáciám. produkovať. Nemyslím si, že to bolo niekedy cieľom tradičného riešenia MDM. Tieto riešenia sú zvyčajne zamerané na ľudí, ktorí potrebujú predkladať správy o tom, aké údaje boli zaznamenané do SCC alebo interne na iný účel auditu. Niekedy to môže analytikom umožniť, ale častejšie, ak to umožní praktizujúcemu vo svojej práci, je pravdepodobnejšie, že umožní dátovému architektovi, ako je DBA.

Keď premýšľate o veciach z pohľadu analytika, to je, keď začnete vytvárať dotazovací nástroj, ktorý by nástroj MDM nikdy neurobil. To je, keď začnete premýšľať o výkone a presnosti, ako aj o tom, aké údaje sa týkajú mojej firmy. Všetky tieto veci sú veci, ktoré sa pri navrhovaní nástroja v našich mysliach javia ako pop. Prechádza do našich vyhľadávacích algoritmov, rozloženia stránok katalógu a schopnosti prispievať poznatkami z celej organizácie. Ide o to, že sme zostavili dotazovací nástroj a že sme do neho zabudovali katalóg priamo, takže si myslím, že z toho skutočne vychádza. Na ktorého používateľa máte ako prvý na mysli?

Rebecca Jozwiak: Dobre, dobre. To naozaj pomohlo vysvetliť. ktorý chcel zomrieť, aby získal archívy, pretože musel odísť, ale naozaj chcel, aby jeho otázka bola zodpovedaná. Povedal, že na začiatku sa uvádza, že existuje viac jazykov, ale je SQL jediným jazykom využívaným v rámci komponentu Compose?

David Crawford: Ano to je pravda. Jednou z vecí, ktoré som si všimol, ako som bol svedkom explózie rôznych typov databáz, databáz dokumentov, grafov, skladov kľúčovej hodnoty, je to, že sú skutočne výkonné pre vývoj aplikácií. Tam môžu slúžiť konkrétnym potrebám naozaj dobre, lepšie ako relačné databázy.

Keď sa však vrátite späť k analýze údajov, keď sa vrátite späť k - keď chcete poskytnúť tieto informácie ľuďom, ktorí sa chystajú robiť ad hoc správy alebo ad hoc kopanie do údajov, že sa vždy vrátia k relačným minimálne rozhranie pre ľudí. Súčasťou toho je len to, že SQL je lingua franca analýzy údajov, čo znamená pre človeka aj jeho nástroje, ktoré sa integrujú. Myslím si, že toto je dôvod, prečo je SQL na Hadoope tak populárne a existuje veľa pokusov o jeho vyriešenie, pretože na konci dňa to ľudia vedia. Pravdepodobne existujú milióny ľudí, ktorí vedia, ako písať SQL, a ja by som sa odvážil nie milióny, ktorí vedia, ako napísať rámcový dotazník agregácie plynovodu Mongo. A je to štandardný jazyk, ktorý sa používa na integráciu do skutočne širokej škály platforiem. Takže všetko, čo sa hovorí, bolo veľmi zriedka požiadané, aby sme z toho vyšli, pretože toto je rozhranie, ktoré väčšina analytikov používa, a na miesto, na ktoré sme sa zamerali, najmä v Compose, sme sa zamerali na písanie SQL.

Povedal by som, že veda o údajoch je miestom, kde sa púšťajú najviac, a preto dostávame príležitostné otázky týkajúce sa používania Pig alebo SAS. Toto sú veci, s ktorými v Compose určite nezvládame a ktoré by sme chceli zachytiť v katalógu. A vidím tiež R a Pythona. Máme niekoľko spôsobov, ako vytvoriť rozhrania, ktoré môžete použiť na dotazy napísané v Alation vo vnútri skriptov R a Python, takže od chvíle, keď ste vedcom údajov a pracujete v skriptovacom jazyku, sú vaše zdrojové údaje v relačnom vzťahu. databáz. Začnete s dotazom SQL a potom ho ďalej spracujete a vytvoríte grafy vo vnútri R a Pythonu. Vytvorili sme balíčky, ktoré môžete importovať do skriptov, ktoré vyvolávajú dotazy alebo výsledky dotazov z Alation, takže tam môžete mať nejaký zmiešaný pracovný tok.

Rebecca Jozwiak: Dobre, skvelé. Viem, že som bežal trochu mimo špičku, len položím jednu alebo dve ďalšie otázky. Viem, že ste hovorili o všetkých rôznych systémoch, ku ktorým sa môžete pripojiť, ale pokiaľ ide o externe hostené údaje a interne hostené údaje, možno ich spoločne vyhľadať do jedného pohľadu, do svojej jedinej platformy?

David Crawford: Istá. Existuje niekoľko spôsobov, ako to urobiť. Myslím tým, navonok hostený, predstavoval by som si. Snažím sa premýšľať o tom, čo by to mohlo znamenať. Môže to znamenať databázu, ktorú pre vás niekto hosťuje v AWS. Mohlo by to znamenať verejný zdroj údajov z data.gov. K databázam sa pripájame priamo tak, že sa prihlásime rovnako ako iná aplikácia pomocou účtu databázy a takto extrahujeme metadáta. Takže ak máme účet a máme otvorený sieťový port, môžeme sa k nemu dostať. A potom, keď tieto veci nemáme, máme niečo, čo sa nazýva virtuálny zdroj údajov, ktorý vám umožňuje v zásade tlačiť dokumentáciu, či už automaticky, napísaním vlastného konektora alebo jeho vyplnením tak, že urobíte dokumentáciu, napríklad nahranie CSV, údaje spolu s vašimi internými údajmi. To všetko umiestni do vyhľadávacieho nástroja. Stane sa referenčným vo vnútri článkov a inej dokumentácie a konverzácií vo vnútri systému. Takto postupujeme, keď sa nemôžeme priamo pripojiť k systému.

Rebecca Jozwiak: Dobre, to dáva zmysel. Vystrihnem ešte jednu otázku. Jeden účastník je pýtajú sa: „Ako by sa mal validovať, overovať alebo udržiavať obsah katalógu údajov, pretože zdrojové údaje sa aktualizujú, ako sa upravujú zdrojové údaje atď.“

David Crawford: Áno, je to otázka, ktorú máme veľa, a myslím si, že jedna z vecí, ktorú my - jedna z našich filozofií, ako som už povedal, neveríme, že používatelia sú škodliví. Predpokladáme, že sa snažia prispieť tým najlepším poznatkom. Neprídu a úmyselne neuvádzajú ľudí o údajoch. Ak je to vo vašej organizácii problém, možno pre vás Alations nie je ten pravý nástroj. Ak však používatelia predpokladajú dobré úmysly, myslíme na to ako na niečo, kam prídu aktualizácie, a potom zvyčajne robíme správcu zodpovedný za každý dátový objekt alebo každú časť údajov. Môžeme informovať tých správcov, keď sa vykonajú zmeny v metaúdajoch a môžu to zvládnuť týmto spôsobom. Vidia prichádzať aktualizácie, potvrdzujú ich. Ak nemajú pravdu, môžu sa vrátiť a upraviť ich, informovať a, dúfajme, dokonca osloviť používateľa, ktorý informácie poskytol, a pomôcť im učiť sa.

To je primárny spôsob, ako o tom premýšľať. Takýto návrh davu a riadenie zo strany správcov, takže máme okolo toho určité schopnosti.

Rebecca Jozwiak: Dobre, dobre. A ak by ste len mohli dať ľuďom vedieť, ako môžu čo najlepšie začať s Alation, a kam môžu ísť konkrétne, aby získali viac informácií. Viem, že ste sa o niečo podelili. Je to najlepšie miesto?

David Crawford: Alation.com/learnmore Myslím, že je skvelý spôsob, ako ísť. Ak sa chcete zaregistrovať na ukážku, na webe Alation.com nájdete veľa skvelých zdrojov, dokumenty o zákazníkoch a správy o našom riešení. Takže si myslím, že je to skvelé miesto, kde začať. Môžete tiež .

Rebecca Jozwiak: Dobre, skvelé. A viem, účastníci, ospravedlňujem sa, že som sa dnes nedostal na všetky otázky, ale ak nie, budú postúpené Davidovi alebo jeho predajnému tímu alebo niekomu v spoločnosti Alation, aby určite pomohli odpovedať na vaše otázky a pomôcť pochopiť, čo Alation čo robia alebo čo robia najlepšie.

A s tým, ľudia, pôjdem do toho a odhlási nás. Archívy nájdete vždy na stránke InsideAnalysis.com. Nájdete ho aj na stránke Techopedia.com. Majú tendenciu sa aktualizovať o niečo rýchlejšie, takže si to určite overte. A ďakujem dnes Davidovi Crawfordovi, Dez Blanchfieldovi a Robinovi Boorovi. Bol to skvelý webcast. A s tým sa rozlúčim. Vďaka, ľudia. Zbohom.

David Crawford: Ďakujem.