Data-opschoning

Schrijver: Randy Alexander
Datum Van Creatie: 26 April 2021
Updatedatum: 1 Juli- 2024
Anonim
02 data opschonen
Video: 02 data opschonen

Inhoud

Definitie - Wat betekent Data Cleansing?

Gegevens opschonen is het proces waarbij gegevens in een bepaalde opslagresource worden gewijzigd om ervoor te zorgen dat deze nauwkeurig en correct zijn. Er zijn veel manieren om gegevens op te schonen in verschillende software- en gegevensopslagarchitecturen; de meeste daarvan concentreren zich op de zorgvuldige beoordeling van gegevenssets en de protocollen die horen bij een bepaalde technologie voor gegevensopslag.


Gegevens opschonen wordt ook wel gegevens opschonen of gegevens opschonen genoemd.

Een inleiding tot Microsoft Azure en de Microsoft Cloud | In deze handleiding leert u wat cloud computing inhoudt en hoe Microsoft Azure u kan helpen bij het migreren en runnen van uw bedrijf vanuit de cloud.

Techopedia verklaart Data Cleansing

Gegevens opschonen wordt soms vergeleken met gegevens opschonen, waarbij oude of nutteloze gegevens uit een gegevensset worden verwijderd. Hoewel het opschonen van gegevens kan bestaan ​​uit het verwijderen van oude, onvolledige of gedupliceerde gegevens, verschilt het opschonen van gegevens in die zin dat gegevens opschonen zich meestal richt op het vrijmaken van ruimte voor nieuwe gegevens, terwijl gegevens opschonen zich richt op het maximaliseren van de nauwkeurigheid van gegevens in een systeem. Een methode voor het opschonen van gegevens kan parsing of andere methoden gebruiken om syntaxisfouten, typografische fouten of fragmenten van records te verwijderen. Een zorgvuldige analyse van een gegevensset kan laten zien hoe het samenvoegen van meerdere sets tot duplicatie heeft geleid, in welk geval het opschonen van gegevens kan worden gebruikt om het probleem op te lossen.


Veel problemen met het opschonen van gegevens zijn vergelijkbaar met problemen waarmee archivarissen, databasebeheerders en anderen te maken krijgen rond processen zoals gegevensonderhoud, gerichte datamining en de ETL-methode (extract, transform, load), waarbij oude gegevens opnieuw worden geladen in een nieuwe gegevensset. Deze problemen betreffen vaak de syntaxis en het specifieke gebruik van commando's om gerelateerde taken uit te voeren in database- en servertechnologieën zoals SQL of Oracle. Databasebeheer is een zeer belangrijke rol in veel bedrijven en organisaties die afhankelijk zijn van grote datasets en nauwkeurige records voor handel of andere initiatieven.