Distribuovaný systém súborov Hadoop (HDFS)

Autor: Judy Howell
Dátum Stvorenia: 28 V Júli 2021
Dátum Aktualizácie: 23 V Júni 2024
Anonim
Distribuovaný systém súborov Hadoop (HDFS) - Technológie
Distribuovaný systém súborov Hadoop (HDFS) - Technológie

Obsah

Definícia - Čo znamená Hadoop Distributed File System (HDFS)?

Distribuovaný súborový systém Hadoop (HDFS) je distribuovaný súborový systém, ktorý beží na štandardnom alebo nízkom hardvéri. HDFS, vyvinuté spoločnosťou Apache Hadoop, funguje ako štandardný distribuovaný súborový systém, ale poskytuje lepšiu priepustnosť a prístup k údajom prostredníctvom algoritmu MapReduce, vysokú odolnosť proti chybám a natívnu podporu veľkých súborov údajov.


Úvod do programu Microsoft Azure a Microsoft Cloud V tejto príručke sa dozviete, o čom všetko je cloud computing a ako vám môže Microsoft Azure pomôcť migrovať a podnikať z cloudu.

Techopedia vysvetľuje systém Hadoop Distributed File System (HDFS)

HDFS ukladá veľké množstvo údajov umiestnených na viacerých počítačoch, zvyčajne v stovkách a tisícoch súčasne pripojených uzlov, a poskytuje spoľahlivosť údajov replikovaním každej inštancie údajov ako tri rôzne kópie - dve v jednej skupine a jednu v druhej. Tieto kópie sa môžu v prípade zlyhania vymeniť.

Architektúra HDFS pozostáva z klastrov, z ktorých každý je prístupný prostredníctvom jediného softvérového nástroja NameNode nainštalovaného na samostatnom stroji na monitorovanie a správu súborového systému klastra a mechanizmu prístupu používateľov. Ostatné počítače inštalujú jednu inštanciu DataNode na správu úložiska klastrov.


Pretože systém HDFS je napísaný v jazyku Java, má natívnu podporu pre programovacie rozhrania aplikácií Java (API) na integráciu a prístupnosť aplikácií. Prístup k nemu je možný aj prostredníctvom štandardných webových prehliadačov.