Hadoop Distributed File System (HDFS)

Schrijver: Judy Howell
Datum Van Creatie: 28 Juli- 2021
Updatedatum: 1 Juli- 2024
Anonim
What is HDFS | Hadoop Distributed File System (HDFS) Introduction | Hadoop Training | Edureka
Video: What is HDFS | Hadoop Distributed File System (HDFS) Introduction | Hadoop Training | Edureka

Inhoud

Definitie - Wat betekent Hadoop Distributed File System (HDFS)?

Het Hadoop Distributed File System (HDFS) is een gedistribueerd bestandssysteem dat op standaard- of low-end hardware draait. HDFS is ontwikkeld door Apache Hadoop en werkt als een standaard gedistribueerd bestandssysteem, maar biedt een betere gegevensdoorvoer en toegang via het MapReduce-algoritme, hoge fouttolerantie en native ondersteuning van grote gegevenssets.


Een inleiding tot Microsoft Azure en de Microsoft Cloud | In deze handleiding leert u wat cloud computing inhoudt en hoe Microsoft Azure u kan helpen bij het migreren en runnen van uw bedrijf vanuit de cloud.

Techopedia verklaart Hadoop Distributed File System (HDFS)

De HDFS slaat een grote hoeveelheid gegevens op meerdere machines op, meestal in honderden en duizenden gelijktijdig verbonden knooppunten, en biedt gegevensbetrouwbaarheid door elke gegevensinstantie te repliceren als drie verschillende kopieën - twee in één groep en één in een andere. Deze kopieën kunnen worden vervangen in geval van storing.

De HDFS-architectuur bestaat uit clusters, die elk toegankelijk zijn via een enkele NameNode-softwaretool die op een afzonderlijke machine is geïnstalleerd om het bestandssysteem van die clusters en het mechanisme voor gebruikerstoegang te bewaken en beheren. De andere machines installeren één exemplaar van DataNode om clusteropslag te beheren.


Omdat HDFS in Java is geschreven, biedt het native ondersteuning voor Java Application Programming Interfaces (API) voor applicatie-integratie en toegankelijkheid. Het is ook toegankelijk via standaard webbrowsers.