Functie: data-wetenschapper

Schrijver: Roger Morrison
Datum Van Creatie: 28 September 2021
Updatedatum: 11 Kunnen 2024
Anonim
Webinar: Data en innovatie met Douwe Broekens
Video: Webinar: Data en innovatie met Douwe Broekens

Inhoud


Bron: Sergey Khakimullin / iStockphoto

Afhaal:

Gegevenswetenschappers hebben uiteenlopende taken die aanzienlijk verschillen per toepassing. Maar één ding hebben ze allemaal gemeen: de drive om goed gebruik te maken van data.

Wat doet een datawetenschapper op het gebied van kunstmatige intelligentie en machine learning? Veel professionals die dagelijks met dit soort projecten werken, zouden zeggen dat de vraag moeilijk te beantwoorden is. Een betere vraag zou zijn: wat doen datawetenschappers NIET?

Een datawetenschapper is een integraal onderdeel van een AI- of ML-proces, in de zin dat al deze projecten afhankelijk zijn van big data of complexe input. De datawetenschapper is de essentiële carrière-expert die weet hoe hij met gegevens moet werken om resultaten te produceren.

Er zijn echter enkele manieren om te praten over wat een datawetenschapper doet, welke kwalificaties hij of zij nodig heeft en wat zijn of haar rol in het proces is.


Lezen: 6 belangrijke data science-concepten die u kunt beheersen door online leren

Gevarieerde definities, gevarieerde taken

Veel experts die het werk van een datawetenschapper beschrijven, spreken er breed over.

“Bij kleine bedrijven of bij het werken in een nieuwe markt, is de rol van een datawetenschapper om relatief nieuwe (maar voor de hand liggende) gegevensbronnen om te zetten in dingen die een probleem voor een eindgebruiker oplossen, wat voorheen niet mogelijk zou zijn geweest, waar de gebruikte technologieën niet bestonden, ”zegt Antonio Hicks, een accountmanager bij Mercury Global Partners. "De ideale kandidaat is iemand die deels wiskundige, deels software-engineer en deels ondernemer is."

Anderen volgen dit basisidee en vermelden wat datawetenschappers nodig hebben om modelleringsprojecten aan te pakken.

"Het belangrijkste kenmerk dat een datawetenschapper nodig heeft, is een diepe nieuwsgierigheid naar de wereld om hen heen - of ze nu vragen beantwoorden of modellen bouwen, de wens om het probleem dat voor hen ligt te begrijpen, is cruciaal", zegt Erin Akinci, Data Scientist Manager in Asana. "Van daaruit zullen de meeste mensen vaardigheden in wiskunde en programmeren nodig hebben om oplossingen te vinden, maar de specifieke soorten wiskunde en programmeren variëren sterk, afhankelijk van het expertisegebied binnen de gegevenswetenschap."


Geen bugs, geen stress - Uw stapsgewijze handleiding voor het creëren van levensveranderende software zonder uw leven te vernietigen

U kunt uw programmeervaardigheden niet verbeteren als niemand om softwarekwaliteit geeft.

“Uitstekend wetenschappelijk werk heeft meer te maken met de manier waarop een wetenschapper over een probleem denkt, dan met de tools die ze gebruiken om het op te lossen,” voegt Charlie Burgoyne, oprichter en CEO van Valkyrie Intelligence toe. Valkyrie is een adviesbureau voor toegepaste wetenschap met indrukwekkende projecten onder zijn hoede, zoals de Mark I, een speciaal netwerkapparaat dat neurale netwerktraining en -testen stimuleert, wat de mogelijkheden van voorgaande cloudgebaseerde machine learning-platforms verbetert.

"De markt vereist wetenschappers die bedreven zijn in Python-ontwikkeling, neuraal netwerkontwerp en de mogelijkheid om een ​​gegevensrepository om te vormen naar de nieuwste database-architectuur", zegt Burgoyne. “Die capaciteiten zijn echter tafelinzet voor een getalenteerde wetenschapper. Wat minder voor de hand ligt, is de aanleg van een wetenschapper voor onverschrokken nieuwsgierigheid, agressieve vindingrijkheid en naleving van de wetenschappelijke methode. "

De vaardigheden van een datawetenschapper

Dus wat praktische vaardigheden betreft, hebben datawetenschappers enige creativiteit en kennis nodig voor het modelleren. Ze kunnen ook veel baat hebben bij het hebben van 'harde vaardigheden' zoals ervaring met coderen in Python, C ++ of andere veel voorkomende talen die op ML-projecten worden toegepast.

"Python en C ++ zijn essentieel en in staat zijn om codeervaardigheden te combineren met data-analyse en verwerking en statistieken zijn kernvaardigheden die ervoor zorgen dat een datawetenschapper opvalt als een sterke kandidaat of werknemer", zegt Val Streif van Pramp, een online mock interviewplatform voor software-ingenieurs, ontwikkelaars en datawetenschappers. "Hoewel voor sommige programmeervaardigheden kan worden gezorgd door een datawetenschapper te koppelen aan een ontwikkelaar, is het veel gemakkelijker als je beide vaardigheden in één hebt gecombineerd, vanuit het perspectief van een bedrijf."

Andere experts voegen R, Hadoop, Spark, Sas en Java toe aan de lijst, evenals technologieën zoals Tableau, Hive en MATLAB.

Allemaal zorgen voor een indrukwekkend cv, maar sommigen die ervaring hebben met het werven van datawetenschappers zeggen ook dat de andere 'menselijke' kant aan de orde is. (Een type datawetenschapper is de citizen data scientist. Meer informatie in De rol van Citizen Data Scientists in de Big Data World.)

"Traditioneel maken individuen met een gevarieerde opleiding voor vrije kunsten uitstekende datawetenschappers," zegt Burgoyne, en maakt een onderscheid tussen ingenieurs aan de bouwkant, en datawetenschapper, wiens werk veel meer conceptueel kan zijn. Hij gaat door:

Expertise in een traditioneel STEM-veld met een complementaire focus in de geesteswetenschappen, kunst of zakelijke domeinen levert die kwaliteiten op die een uitstekende industrie-georiënteerde wetenschapper maken. Het moet gezegd worden dat het net zo belangrijk is voor het vermogen van de organisatie om die kwaliteiten te benutten en hun ijver en methoden op een productieve manier vorm te geven. Ik heb gemerkt dat wanneer een gegevenswetenschappelijk initiatief niet succesvol is, de organisatie even waarschijnlijk schuldig is als de wetenschappers. Wetenschappers zijn geen ingenieurs. Ze zijn niet gedreven om uit te voeren en te bouwen. Ze worden gedreven om te ontdekken en te begrijpen. Organisaties die dit verschil begrijpen, worden goed beloond voor de teelt van beide velden.

Wat betreft de gegevens waarvoor wetenschappers zich doorgaans richten, heeft dat te maken met de kerndoelen van het bedrijf. Sommige bedrijven jagen op een gedecentraliseerd internet - sommige spelen met IoT of SaaS. Anderen proberen "gebruikersvriendelijke" of "ethische" of "transparante" AI te pionieren.

In elk geval zullen datawetenschappers waarschijnlijk de kloof overbruggen tussen de harde meetwaarden van de gegevens die ze gebruiken, in welke technologiestapel die ook speelt, en het vrijloopwerk van het conceptualiseren van AI / ML-functionaliteit.

"We nemen datawetenschappers in dienst om het verzamelen en opschonen van gegevens te beheren en deze gegevens te vertalen in betekenisvolle informatie", zegt Michael Hupp, Manager Data Science and Analytics bij G2 Crowd. Hij licht toe:

Meestal betekent dat het beheren van alle belangrijke algoritmen die de gegevensmotor van een bedrijf aansturen en vloeiend zijn in belangrijke analysetools en talen, maar in de afgelopen jaren omvatte ook opkomende gebieden zoals natuurlijke taalverwerking, machinaal leren, andere vormen van AI-geactiveerde analyse. De meest succesvolle datawetenschappers zijn degenen die hun harde vaardigheden combineren met het vermogen om snel te leren, en het vermogen om de inzichten die ze ontdekken effectief te communiceren, zodat ze betekenisvol zijn voor hun bedrijf.

Met dit soort inzichten is het voor jonge professionals of studenten gemakkelijker om erachter te komen of datawetenschapper een goede rol voor hen zou zijn, en hoe vaardigheden te verwerven. STEM-leren wordt steeds toegankelijker op scholen in het hele land, maar er is geen vervanging voor een passie voor codering en technologie, en de mogelijkheid om direct te leren.