Neštruktúrovaná ťažba údajov

Autor: Eugene Taylor
Dátum Stvorenia: 13 August 2021
Dátum Aktualizácie: 22 V Júni 2024
Anonim
Neštruktúrovaná ťažba údajov - Technológie
Neštruktúrovaná ťažba údajov - Technológie

Obsah

Definícia - Čo znamená neštruktúrovaná ťažba údajov?

Neštruktúrovaná ťažba údajov je prax, pri ktorej sa skúmajú relatívne neštruktúrované údaje a snaží sa z nich získať podrobnejšie súbory údajov. Často pozostáva z extrahovania údajov zo zdrojov, ktoré sa tradične nepoužívajú na činnosti v oblasti získavania údajov.

Úvod do programu Microsoft Azure a Microsoft Cloud V tejto príručke sa dozviete, o čom všetko je cloud computing a ako vám môže Microsoft Azure pomôcť migrovať a podnikať z cloudu.

Techopedia vysvetľuje neštruktúrovanú ťažbu údajov

Vo všeobecnosti je ťažba údajov praxou česania sa cez súbory údajov a snaženia sa získať len tie najcennejšie informácie do konkrétneho formátu. To je zvyčajne ťažšie pri relatívne neštruktúrovaných údajoch. Odborníci v oblasti IT definujú neštruktúrované údaje ako údaje, ktoré nie sú v špecifickom formáte, údaje, ktoré sú „ťažké“ alebo údaje „skryté“ v nepresných dokumentoch, ktoré nie sú formálne objednané na poskytnutie technických informácií.

Príkladom neštruktúrovaného dokumentu by mohol byť list alebo korešpondencia medzi dvoma alebo viacerými stranami. V prípade neštruktúrovanej ťažby údajov by technológie rozobrali tento list, pričom by hľadali konkrétne identifikátory a kúsky informácií, ako sú mená prepojených strán, dátumy zaslania listov, názvy zúčastnených podnikov, sumy meny alebo iné vyčíslenie. kúsky údajov alebo kódy priradené konkrétnym výrobkom, službám alebo obchodom. Tieto druhy údajov sa ťažia a potom ukladajú do formátu, ktorý môžu podniky alebo iné strany použiť na rýchlu referenciu alebo na vyvinuté aplikácie business intelligence.