Ťažba textových údajov

Autor: Louise Ward
Dátum Stvorenia: 9 Február 2021
Dátum Aktualizácie: 26 V Júni 2024
Anonim
Ťažba textových údajov - Technológie
Ťažba textových údajov - Technológie

Obsah

Definícia - Čo znamená dolovanie údajov?

Dolovanie údajov zahŕňa prebudovanie dokumentu alebo zdroja za účelom získania cenných štruktúrovaných informácií.Vyžaduje si to sofistikované analytické nástroje, ktoré sa spracúvajú s cieľom získať konkrétne kľúčové slová alebo kľúčové údajové body z toho, čo sa považuje za relatívne surové alebo neštruktúrované formáty.


dolovanie údajov je známe aj ako ťažba alebo analytika.

Úvod do programu Microsoft Azure a Microsoft Cloud V tejto príručke sa dozviete, o čom všetko je cloud computing a ako vám môže Microsoft Azure pomôcť migrovať a podnikať z cloudu.

Techopedia vysvetľuje ťažbu dát

Pri dolovaní dát používajú inžinierske systémy veci ako taxonómia a lexikálna analýza na určenie, ktoré časti dokumentu sú hodnotné ako ťažené údaje. Štatistické modely sú bežne užitočné a systémy môžu používať heuristiku alebo algoritmické odhady, aby sa pokúsili určiť, ktoré časti sú dôležité. Medzi ďalšie kontrolné systémy patrí značkovanie a analýza kľúčových slov, kde nástroje hľadajú konkrétne správne mená alebo iné značky a kľúčové slová, aby zistili, o čom sa píše.


Ďalšou jedinečnou súčasťou ťažby sa často nazýva analýza sentimentu. V analýze sentimentu, ktorá je vo všeobecnosti oveľa zložitejšia ako štatistická analýza, sa analytické nástroje snažia zistiť náladu alebo sentiment za písomnými a inými aspektmi toho, čo riešia, na veľmi subjektívnej a intuitívnej úrovni. So vznikom nástrojov umelej inteligencie sa v analýze sentimentu urobilo veľa pokroku, takže moderná data mining nie je len zbieranie kvantitatívnych odkazov, ale zahŕňa aj zavádzanie koncepčných modelov na vysokej úrovni do ťažby, aby sa zistili nové a jedinečné spôsoby agregácie. cenné údaje.