Wat is het verschil tussen big data en Hadoop?

Schrijver: Judy Howell
Datum Van Creatie: 5 Juli- 2021
Updatedatum: 23 Juni- 2024
Anonim
Big Data Explained. 4 Vs of Big Data
Video: Big Data Explained. 4 Vs of Big Data

Inhoud

Q:

Wat is het verschil tussen big data en Hadoop?


EEN:

Het verschil tussen big data en het open source softwareprogramma Hadoop is duidelijk en fundamenteel. De eerste is een pluspunt, vaak een complexe en dubbelzinnige, terwijl de tweede een programma is dat een reeks doelen en doelstellingen voor het omgaan met die plus bereikt.

Big data is gewoon de grote hoeveelheid gegevens die bedrijven en andere partijen samenbrengen om specifieke doelen en activiteiten te dienen. Big data kan veel verschillende soorten gegevens in veel verschillende soorten formaten bevatten. Bedrijven kunnen bijvoorbeeld veel werk verzetten bij het verzamelen van duizenden gegevens over aankopen in valuta-indelingen, over klant-ID's zoals naam of sofinummer, of over productinformatie in de vorm van modelnummers, verkoopnummers of inventarisnummers. Dit alles, of een andere grote hoeveelheid informatie, kan big data worden genoemd. In de regel is het rauw en ongesorteerd totdat het door verschillende soorten tools en handlers wordt gehaald.


Hadoop is een van de tools die is ontworpen om big data te verwerken. Hadoop en andere softwareproducten werken om de resultaten van big data-zoekopdrachten te interpreteren of te ontleden via specifieke gepatenteerde algoritmen en methoden. Hadoop is een open-sourceprogramma onder de Apache-licentie dat wordt onderhouden door een wereldwijde gemeenschap van gebruikers. Het bevat verschillende hoofdcomponenten, waaronder een set functies van MapReduce en een door Hadoop gedistribueerd bestandssysteem (HDFS).

Het idee achter MapReduce is dat Hadoop eerst een grote gegevensset kan toewijzen en vervolgens die inhoud kan verminderen voor specifieke resultaten. Een verkleiningsfunctie kan worden gezien als een soort filter voor onbewerkte gegevens. Het HDFS-systeem dient vervolgens om gegevens over een netwerk te distribueren of indien nodig te migreren.

Databasebeheerders, ontwikkelaars en anderen kunnen de verschillende functies van Hadoop gebruiken om op verschillende manieren met big data om te gaan. Hadoop kan bijvoorbeeld worden gebruikt om datastrategieën zoals clustering en targeting met niet-uniforme gegevens na te streven, of gegevens die niet netjes in een traditionele tabel passen of goed reageren op eenvoudige vragen.