Open-source big data-analyse

Schrijver: Laura McKinney
Datum Van Creatie: 1 April 2021
Updatedatum: 14 Kunnen 2024
Anonim
Data Analysis with Python - Full Course for Beginners (Numpy, Pandas, Matplotlib, Seaborn)
Video: Data Analysis with Python - Full Course for Beginners (Numpy, Pandas, Matplotlib, Seaborn)

Inhoud

Definitie - Wat betekent Open-Source Big Data Analytics?

Open-source big data-analyse verwijst naar het gebruik van open-source software en tools voor het analyseren van enorme hoeveelheden gegevens om relevante en bruikbare informatie te verzamelen die een organisatie kan gebruiken om haar bedrijfsdoelstellingen te bevorderen. De grootste speler in open-source big data-analyse is Apaches Hadoop - het is de meest gebruikte softwarebibliotheek voor het verwerken van enorme datasets over een cluster van computers met behulp van een gedistribueerd proces voor parallellisme.


Een inleiding tot Microsoft Azure en de Microsoft Cloud | In deze gids leert u waar cloud computing over gaat en hoe Microsoft Azure u kan helpen bij het migreren en runnen van uw bedrijf vanuit de cloud.

Techopedia verklaart Open-Source Big Data Analytics

Open-source big data-analyse maakt gebruik van open-source software en tools om big data-analyse uit te voeren met behulp van een volledig softwareplatform of verschillende open-source tools voor verschillende taken in het proces van data-analyse. Apache Hadoop is het meest bekende systeem voor big data-analyse, maar andere componenten zijn vereist voordat een echt analysesysteem kan worden samengesteld.

Hadoop is de open-source implementatie van het MapReduce-algoritme ontwikkeld door Google en Yahoo, dus het is de basis van de meeste analysesystemen van vandaag. Veel big data-analysehulpmiddelen maken gebruik van open source, inclusief robuuste databasesystemen zoals de open-source MongoDB, een geavanceerde en schaalbare NoSQL-database die zeer geschikt is voor big data-applicaties, evenals andere.


Open-source big data-analyseservices omvatten:

  • Gegevensverzamelsysteem
  • Controlecentrum voor het beheren en monitoren van clusters
  • Machine learning en data mining bibliotheek
  • Service coördinatie applicatie
  • Bereken motor
  • Uitvoeringskader