SQL na Hadoop

Autor: Roger Morrison
Dátum Stvorenia: 19 September 2021
Dátum Aktualizácie: 21 V Júni 2024
Anonim
Query Data in Hadoop Using ANSI SQL
Video: Query Data in Hadoop Using ANSI SQL

Obsah

Definícia - Čo znamená SQL na Hadoope?

SQL on Hadoop je typ analytického aplikačného nástroja - implementácia SQL na platforme Hadoop, ktorá kombinuje štandardné dotazovanie štruktúrovaných údajov v štýle SQL s dátovým rámcom Hadoop. Hadoop je relatívne nová platforma, rovnako ako samotné veľké údaje, a nie je v nej veľa odborníkov, ale SQL na Hadoop zjednodušuje prístup do rámca Hadoop a uľahčuje implementáciu do súčasných podnikových systémov.


Úvod do programu Microsoft Azure a Microsoft Cloud V tejto príručke sa dozviete, o čom všetko je cloud computing a ako vám môže Microsoft Azure pomôcť migrovať a podnikať z cloudu.

Techopedia vysvetľuje SQL na Hadoop

SQL na Hadoop odkazuje na rôzne implementácie SQL pre platformu Hadoop. MapReduce, ktorý je mapovačom úloh a organizátorom výsledkov klastra Hadoops, podporuje SQL ako hlavný prípad použitia, ako aj ďalšie metódy spracovania. Preto má zmysel vytvárať výkonné nástroje na povolenie jazyka SQL, ktorý je jedným z najpoužívanejších jazykov na databázové dotazy a manipuláciu. Pretože Hadoop získava popularitu pre architektúru podnikových údajov, SQL je kľúčom k správnemu prijatiu voľne štruktúrovaných údajov aj štruktúrovaných údajov používaných v Hadoope.


Kľúčové ovládače SQL na kľúčoch Hadoop zahŕňajú:

  • Využitie existujúcich zručností v oblasti SQL prítomných vo väčšine organizácií
  • Opätovné použitie extrakčného transformačného zaťaženia (ETL), business intelligence (BI) a investícií do analytickej infraštruktúry v Hadoop

Niektoré implementácie SQL na Hadoop zahŕňajú:

  • Apache Spark SQL
  • Úľ Apache
  • Apache Tajo
  • Vŕtačka Apache
  • HP Vertica na MapR
  • Ovládače ODBC
  • Presto
  • žralok