Analýza veľkých dát s otvoreným zdrojom

Autor: Laura McKinney
Dátum Stvorenia: 1 Apríl 2021
Dátum Aktualizácie: 14 Smieť 2024
Anonim
Analýza veľkých dát s otvoreným zdrojom - Technológie
Analýza veľkých dát s otvoreným zdrojom - Technológie

Obsah

Definícia - Čo znamená Open-Source Big Data Analytics?

Open-source analýza veľkých dát sa týka použitia open-source softvéru a nástrojov na analýzu veľkého množstva údajov s cieľom zhromaždiť relevantné a uskutočniteľné informácie, ktoré organizácia môže použiť na podporu svojich obchodných cieľov. Najväčším hráčom v open-source analýze veľkých dát je Apaches Hadoop - je to najpoužívanejšia softvérová knižnica na spracovanie obrovských množín údajov v klastri počítačov pomocou distribuovaného procesu pre paralelizmus.


Úvod do programu Microsoft Azure a Microsoft Cloud V tejto príručke sa dozviete, o čom všetko je cloud computing a ako vám môže Microsoft Azure pomôcť migrovať a podnikať z cloudu.

Techopedia vysvetľuje open-source analýzu veľkých dát

Open-source analýza veľkých dát využíva open-source softvér a nástroje na vykonávanie analýzy veľkých dát pomocou celej softvérovej platformy alebo rôznych open-source nástrojov pre rôzne úlohy v procese analýzy dát. Apache Hadoop je najznámejší systém pre analýzu veľkých dát, ale pred zostavením skutočného analytického systému sú potrebné ďalšie komponenty.

Hadoop je open-source implementácia algoritmu MapReduce priekopníkom spoločností Google a Yahoo, takže je základom väčšiny analytických systémov dnes. Mnoho veľkých nástrojov na analýzu údajov využíva otvorený zdroj vrátane robustných databázových systémov, ako je napríklad otvorený zdroj MongoDB, sofistikovaná a škálovateľná databáza NoSQL, ktorá sa veľmi dobre hodí pre veľké dátové aplikácie, ako aj iné.


Služby analýzy veľkých dát s otvoreným zdrojom zahŕňajú:

  • Systém zberu údajov
  • Riadiace stredisko pre správu a monitorovanie klastrov
  • Knižnica strojového učenia a získavania údajov
  • Koordinačná služba aplikácií
  • Vypočítajte motor
  • Vykonávací rámec