Trainingsdata

Video: Machine Learning Tutorial Python - 7: Training and Testing Data

Inhoud

Definitie - Wat betekent trainingsgegevens?
Een inleiding tot Microsoft Azure en de Microsoft Cloud | In deze handleiding leert u wat cloud computing inhoudt en hoe Microsoft Azure u kan helpen bij het migreren en runnen van uw bedrijf vanuit de cloud.
Techopedia legt trainingsgegevens uit

Definitie - Wat betekent trainingsgegevens?

Het idee om trainingsgegevens te gebruiken in machine learning-programma's is een eenvoudig concept, maar het is ook erg fundamenteel voor de manier waarop deze technologieën werken. De trainingsgegevens zijn een eerste set gegevens die worden gebruikt om een programma te helpen begrijpen hoe technologieën zoals neurale netwerken kunnen worden toegepast om geavanceerde resultaten te leren en te produceren. Het kan worden aangevuld met opeenvolgende gegevenssets die validatie- en testsets worden genoemd.

Trainingsgegevens worden ook wel een trainingsset, trainingsdataset of leerset genoemd.

Een inleiding tot Microsoft Azure en de Microsoft Cloud | In deze handleiding leert u wat cloud computing inhoudt en hoe Microsoft Azure u kan helpen bij het migreren en runnen van uw bedrijf vanuit de cloud.

Techopedia legt trainingsgegevens uit

De trainingsset is het materiaal waarmee de computer leert informatie te verwerken. Machine learning maakt gebruik van algoritmen - het bootst de mogelijkheden van het menselijk brein na om verschillende inputs te nemen en ze te wegen, om activeringen in de hersenen, in de individuele neuronen te produceren. Kunstmatige neuronen repliceren veel van dit proces met software - machine learning en neurale netwerkprogramma's die zeer gedetailleerde modellen bieden van hoe onze menselijke denkprocessen werken.

Met dat in gedachten kunnen trainingsgegevens op verschillende manieren worden gestructureerd. Voor sequentiële beslissingsbomen en dat soort algoritmen zou het een set onbewerkte of alfanumerieke gegevens zijn die geclassificeerd of anderszins gemanipuleerd worden. Aan de andere kant, voor convolutionele neurale netwerken die te maken hebben met beeldverwerking en computer vision, bestaat de trainingsset vaak uit grote aantallen beelden. Het idee is dat omdat het machine learning-programma zo complex en zo geavanceerd is, het iteratieve training op elk van die afbeeldingen gebruikt om uiteindelijk functies, vormen en zelfs onderwerpen zoals mensen of dieren te herkennen. De trainingsgegevens zijn absoluut essentieel voor het proces - het kan worden gezien als het "voedsel" dat het systeem gebruikt om te werken.