Data Science of Machine Learning? Hier is hoe het verschil te spotten

Video: Data Science vs Machine Learning – What’s The Difference | Data Science Tutorial | Simplilearn

Inhoud

Data science en machine learning: brede en enge terminologie
Data Science en Machine Learning Skill Sets
Geen bugs, geen stress - Uw stapsgewijze handleiding voor het creëren van levensveranderende software zonder uw leven te vernietigen
Hoe machine learning te herkennen
Twee geavanceerde disciplines

Bron: Elnur / Dreamstime.com

Afhaal:

Data science en machine learning verschillen op belangrijke manieren. In sommige opzichten kan de een worden gezien als een subset van de ander. Beide zijn belangrijk in de huidige IT-vooruitgang.

In deze nieuwe wereld van kunstmatige intelligentie en gegevensbeheer raakt u gemakkelijk in de war door enkele van de termen die het meest worden gebruikt in de IT-wereld.

Data science en machine learning hebben bijvoorbeeld veel met elkaar te maken. Het is niet verwonderlijk dat veel mensen met alleen een voorbijgaande kennis van deze disciplines moeite hebben om erachter te komen hoe ze van elkaar verschillen.

Dit is de beste manier om data science te scheiden van machine learning, in principe en als technologische benadering.

Data science en machine learning: brede en enge terminologie

Allereerst is data science echt een brede, overkoepelende categorie technologie die veel verschillende soorten projecten en creaties omvat. (Zie Job Role: Data Scientist voor meer informatie over wat betrokken is bij een data science-functie.)

Data science is in wezen het werken met big data. Het werd de wet van Moore en de verspreiding van efficiëntere opslagapparatuur leidde ertoe dat enorme hoeveelheden gegevens werden verzameld door bedrijven en andere partijen. Toen begonnen big data-platforms en tools zoals Hadoop de computer opnieuw te definiëren door te veranderen hoe datamanagement werkt. Nu, met cloud en containerisatie en gloednieuwe modellen, is big data een belangrijke drijfveer geworden van de manieren waarop we werken en leven.

In zijn eenvoudigste vorm is data science de manier waarop we die gegevens beheren, van het opschonen en verfijnen tot het gebruik ervan in de vorm van inzichten.

De definitie van machine learning is veel beperkter. In machine learning nemen technologieën gegevens op en zetten deze door algoritmen, om menselijke cognitieve processen te beschrijven die worden beschreven als 'leren'. Met andere woorden, de gegevens hebben opgenomen en erop getraind, kan de computer zijn eigen resultaten geven , waar de technologie lijkt te hebben geleerd van de processen die programmeurs hebben ingevoerd.

Data Science en Machine Learning Skill Sets

Een andere manier om datawetenschap en machine learning te contrasteren, is door te kijken naar de verschillende vaardigheden die het meest waardevol zijn voor professionals in een van deze gebieden.

Geen bugs, geen stress - Uw stapsgewijze handleiding voor het creëren van levensveranderende software zonder uw leven te vernietigen

U kunt uw programmeervaardigheden niet verbeteren als niemand om softwarekwaliteit geeft.

Er is een algemene consensus dat datawetenschappers profiteren van diepgaande analytische en wiskundige vaardigheden, praktische ervaring met databasetechnologieën en kennis van programmeertalen zoals Python of andere pakketten die worden gebruikt voor het parseren van big data.

"Iedereen die geïnteresseerd is in het opbouwen van een sterke carrière in (data science) moet sleutelvaardigheden opdoen in drie afdelingen: analyse, programmeren en domeinkennis", schrijft Srihari Sasikumar bij Simplilearn. “Als je een niveau dieper gaat, helpen de volgende vaardigheden je om een niche te vinden als datawetenschapper: Sterke kennis van Python, SAS, R (en) Scala, praktische ervaring in SQL-databasecodering, vermogen om te werken met ongestructureerde gegevens van verschillende bronnen zoals video en sociale media, begrijpen meerdere analytische functies (en) kennis van machine learning. ”

Aan de kant van machine learning noemen experts vaak datamodellering, waarschijnlijkheid en kennis van statistieken en bredere programmeervaardigheden als handige hulpmiddelen in de toolkit van de machine learning engineer.

Hoe machine learning te herkennen

De sleutel hier is dat allerlei dingen data science-werk omvatten, maar het is geen machine learning tenzij je een zeer strikt regime hebt ingesteld om de computer te helpen leren van zijn input.

Wanneer dat op zijn plaats is, zorgt het voor een aantal verrassend capabele systemen die een breed effect op ons leven kunnen hebben.

"Veel van wat we doen met machine learning gebeurt onder de oppervlakte", zegt Amazon-oprichter Jeff Bezos naar verluidt op enkele van de toepassingen van dit soort systemen. “Machine learning stimuleert onze algoritmen voor vraagvoorspelling, rangschikking van productzoekopdrachten, product- en dealsaanbevelingen, plaatsingen van merchandising, fraudedetectie, vertalingen en nog veel meer. Hoewel minder zichtbaar, zal een groot deel van de impact van machine learning van dit type zijn - stil maar betekenisvol verbeteren van kernactiviteiten. ”

Een van de meest nuttige voorbeelden hier is de opkomst van het neurale netwerk - het is een veelgebruikte en populaire methode voor het instellen van machine-leerprocessen.

In zijn meest basale vorm bestaat het neurale netwerk uit lagen van kunstmatige neuronen. Elk individueel kunstmatig neuron heeft functionaliteit die equivalent is aan een biologisch neuron - maar in plaats van synapsen en dendrieten heeft het ingangen, een activeringsfunctie en eventuele uitgangen.

Het neurale netwerk is gemaakt om te werken als een menselijk brein en professionals in machine learning gebruiken dit model vaak om resultaten van machine learning te creëren.

Dat is echter niet de enige manier om machine learning te doen. Sommige meer rudimentaire projecten voor machinaal leren omvatten eenvoudig een computer een breed scala aan foto's laten zien (of deze voorzien van andere onbewerkte gegevens), ideeën invoeren via het proces van het gebruik van begeleide machine learning en labelgegevens, en de computer uiteindelijk in staat stellen onderscheid te maken tussen verschillende vormen of items in een gezichtsveld. (Bekijk Machine Learning 101 voor de basisprincipes van machine learning.)

Twee geavanceerde disciplines

Concluderend is machine learning een waardevol onderdeel van data science. Maar data science vertegenwoordigt de grotere grens en de con waarin machine learning plaatsvindt.

In zekere zin zou je kunnen zeggen dat machine learning nooit zou gebeuren zonder big data. Big data zelf zorgde echter niet voor machine learning - in plaats daarvan, nadat we gezamenlijk zoveel gegevens hadden verzameld dat we bijna niet wisten wat we ermee moesten doen, kwamen de meest geesten met deze bio-simulatieprocessen als een supercharged manier van het geven van inzichten.

Een ander goed ding om in gedachten te houden is dat data science op twee belangrijke manieren kan worden toegepast - we kunnen machine learning en kunstmatige intelligentie omarmen, computers voor ons laten denken, of we kunnen data science terugbrengen naar een meer mensgerichte benadering waarbij de computer presenteert eenvoudig resultaten en wij als mensen nemen de beslissingen.

Dat leidt ertoe dat sommige experts, waaronder enkele van de beste innovators van vandaag, pleiten voor een levendiger boekhouding van de manieren waarop we deze technologieën gebruiken.

"(AI) is in staat tot veel meer dan bijna iedereen weet en de snelheid van verbetering is exponentieel," zegt Elon Musk, terwijl hij waarschuwt dat machine learning en AI-programma's toezicht vereisen.

In elk geval zijn zowel data science als machine learning kernonderdelen van de vooruitgang die wij als samenlevingen vandaag op het gebied van technologie boeken.