Data Scientists: The New Rock Stars of the Tech World

Schrijver: Robert Simon
Datum Van Creatie: 24 Juni- 2021
Updatedatum: 1 Juli- 2024
Anonim
Brent Hoberman: "Data scientists are the new rock stars"
Video: Brent Hoberman: "Data scientists are the new rock stars"

Inhoud


Bron: Onradio / iStockphoto

Afhaal:

De rol van datawetenschapper wordt snel de meest gewilde carrière van de technologiewereld. We vroegen topgegevenswetenschapper Jake Porway van The New York Times hoe hij zijn baan kreeg en zijn tips voor succes in het veld.

De rol van datawetenschapper wordt snel de meest gewilde carrière in de technologiewereld. Bedrijven zoals Google, Amazon en LinkedIn gebruiken datawetenschappers om hen te helpen die innovatieve voorsprong in het digitale datatijdperk te behouden. En nu willen data- en technologieliefhebbers datawetenschappers worden, net zoals sommige muzikanten ernaar streven rocksterren te worden. Misschien is dat de reden dat sommige mensen datawetenschappers de nieuwe rocksterren van het technologietijdperk noemen.

Helaas is deze rol nog zo nieuw dat er nog steeds een niveau van onduidelijkheid over is, wat betekent dat veel wannabe data-wetenschappers hun tourbussen de verkeerde weg op rijden. Verdienen data-wetenschappers hun reputatie als rockster? We duiken in de wereld van data science met een interview met Jake Porway, de data scientist van het R&D lab bij The New York Times.


Data Scientists: Tech Rocksterren?

Waarom worden datawetenschappers de nieuwe rocksterren van de technologiewereld genoemd? Deze analogie gaat eigenlijk dieper dan datanummers willen ultracool klinken. Net als een rockster omvat een carrière als data-wetenschappers diversiteit, artistieke vrijheid en aanpassingsvermogen. En net als de rocksterren van de entertainmentwereld, hebben de beste datawetenschappers de neiging om nogal wat aanhangers te werven uit alle geledingen van de data- en technologie-industrie.

Wat een datawetenschapper doet, is heel divers; net zoals muzikanten verschillende instrumenten, tools en technieken gebruiken om muziekstijlen te spelen die even uiteenlopen als jazz en death metal, beheerst een datawetenschapper ook een bepaald instrument en een bepaald veld. Er is ook stijl bij betrokken. En er is ook geen goede of foute manier van werken - het gaat om de impact die het werk op andere mensen heeft.

Toen de Beatles hun liedjes schreven, dicteerde er niet slechts één persoon hoe elke noot op elk instrument moest worden gespeeld. Ze kwamen samen en liepen vast; door creatieve ontdekking vonden ze liedjes die werkten. Het is hetzelfde voor datawetenschappers. Ze moeten het ritme voelen, de groef ingaan en een oplossing harmoniseren. Dit is alleen mogelijk met de juiste hoeveelheid artistieke vrijheid om alle benaderingen, tools en technieken te proberen die je op dit moment te binnen schieten - en de behendigheid om wijzigingen aan te brengen wanneer iets niet klopt.


Zodra een datawetenschapper de kernbeginselen beheerst, wordt hij of zij zich aanpasbaar en krijgt hij het vertrouwen om oplossingen op andere gebieden te bieden. We praten later meer over deze basisprincipes. Het punt dat je hier moet maken, is dat als je eenmaal datawetenschap onder de knie hebt, je de rol kunt spelen naar welk veld je maar wilt, omdat data overal is.

Het ultieme doel van een datawetenschapper is het creëren van enorme hoeveelheden waarde voor het grootst mogelijke aantal mensen. Terwijl een datawetenschapper achter de schermen werkt, is het niet anders dan spelen voor een groot publiek: hoe beter je het werk doet, hoe meer mensen je bereikt - en hoe meer beloningen je ziet.

Gegevenswetenschappers doen wat?

Dus wat doen data-wetenschappers precies? Laten we dit doornemen met een voorbeeld waar we ons allemaal in kunnen vinden.

Geen bugs, geen stress - Uw stapsgewijze handleiding voor het creëren van levensveranderende software zonder uw leven te vernietigen

U kunt uw programmeervaardigheden niet verbeteren als niemand om softwarekwaliteit geeft.

Laten we zeggen dat je je op een dag realiseert dat je op de dag niet dezelfde hoeveelheid energie hebt als vroeger. Dus stel je jezelf een doel: overdag meer energie hebben. Dat is een vrij breed en dubbelzinnig doel. Dus de eerste stap als datawetenschapper is om een ​​deel van die dubbelzinnigheid weg te nemen en de meetbaarheid van deze doelen te kwantificeren. Daar zijn methoden voor. We zullen hier niet op de details ingaan, maar laten we zeggen dat u theoretiseert dat u niet genoeg slaap krijgt en daarom uzelf het subdoel geeft om elke nacht acht uur slaap te krijgen.

Hoewel dit doel iets meetbaarder en minder dubbelzinnig is, heeft het zijn eigen uitdagingen. Je kunt niet echt een timer starten als je in slaap valt, en zelfs als je een timer start nadat je in bed springt, mag je niet meteen in slaap vallen. Bovendien is het moeilijk om rekening te houden met de tijden dat je midden in de nacht wakker wordt. Ten slotte zijn er verschillende soorten slaap, zoals diepe slaap en lichte slaap. Het komt erop neer dat het moeilijk is om de slaap nauwkeurig te meten en daarom nog moeilijker om de impact ervan op uw energieniveau te meten.

Dus wat kan je doen? Nou, als datawetenschapper zou je op zoek zijn naar de nieuwste technologie en ontdekken dat er slaapbewakingsapparatuur is.En als u een dergelijk apparaat hebt gebruikt om uw slaap te meten en digitaal op te nemen, kunt u nauwkeurigere gegevens over uw slaap krijgen en die gegevens in de loop van de tijd verzamelen om een ​​grafiek uit te zetten.

Dit alleen kan je meer inzicht geven in wat er aan de hand is. De visuele weergave geeft je bewustzijn, duidelijkheid en richting. Je zult kunnen zien of je je doel van acht uur slaap per nacht bereikt en, nog belangrijker, in staat zijn om actie te ondernemen als je dat niet bent.

Dit is de basistaak van de datawetenschapper: nieuwe manieren brengen om data te meten en weer te geven zodat meer bewustzijn, duidelijkheid en richting wordt geboden aan degenen die ernaar kijken.

Maar daar stopt een goede datawetenschapper niet. Nadat de gegevens zijn verzameld, kunnen deze worden geïntegreerd met elke andere gemeten activiteit die u gedurende de dag uitvoert. Integreer het met uw productiviteit op basis van gegevens van uw taakbeheersysteem. Integreer het met je gemoedstoestand op basis van tweets en statusupdates. Integreer het met uw gezondheid op basis van bezoeken aan de sportschool of gewichtsverlies. Met de hoeveelheid gegevens die al beschikbaar is en het gemak waarmee deze kunnen worden vastgelegd, zijn de mogelijkheden eindeloos.

Hoe een data-wetenschapper te zijn

Geïnteresseerd in een carrière in data science? Omdat data science zo nieuw is, hebben we een top data scientist gevraagd om inzicht in het veld. Jake Porway is datawetenschapper bij The New York Times en de oprichter van DataKind (oorspronkelijk bekend als Data Without Borders), dat non-profitorganisaties die behoefte hebben aan datawetenschap combineert met freelance en pro-bono datawetenschappers. Porway heeft een informatica-achtergrond en een Ph.D. in statistieken van UCLA. Hier is wat hij te zeggen had over hoe je data science kunt bereiken, hoe je goed kunt presteren en hoe je belangrijke fouten in het veld kunt voorkomen.

1. Verkrijg de juiste vaardigheden

Volgens Porway komt het betreden van het veld neer op drie belangrijke dingen:

  • Praktische computervaardigheden
  • Statistische vaardigheden
  • Een verlangen om te leren

"Je moet in staat zijn om scripts te schrijven om gegevens te schrapen en de algoritmen die je bedenkt, te coderen," zegt Porway. "Je zou je basisstatistieken moeten kennen (en idealiter meer) als je echt zult kunnen beoordelen of de modellen die je aan het bouwen bent of de algoritmen die je aan het schrijven bent doen wat je wilt."

2. Maak verbindingen

Voordat hij bij het R&D lab van de New York Times kwam, werkte Porway in machine learning en computer vision en besteedde hij veel tijd aan het verkrijgen van robots om landmijnen en vliegvliegtuigen te identificeren (hoe cool is dat?). Pas toen hij zijn baan bij The New York Times landde, kreeg hij de mogelijkheid om uit te breiden naar bredere taken op het gebied van datawetenschap, namelijk Project Cascade, dat links van de publicatie op sociale media volgt.

Het belangrijkste om in het veld te komen, zegt Porway, is om te leren.

"Ga op een data science project!" Zegt Porway. "Download wat gegevens, pak wat R en begin met spelen ... Id zeg om je te concentreren op het gebruiken van iets als R naast een basisstatistiekenboek om je te begeleiden bij het verkennen van enkele gegevens. De machine learning en computervaardigheden zullen daarbij komen (van dit hangt natuurlijk af van je ervaringen in het verleden - als je al een statisticus bent, neem dan wat Python!) "

Dan is het tijd om wat connecties te maken. Porway beveelt een lokale meetup-groep aan - omdat deel uitmaken van de data science-gemeenschap 'de snelste manier is om te weten wat je niet weet'. En in een veld dat voortdurend evolueert, dat is belangrijk.

3. Neem deel aan het spel

Porway heeft een Ph.D. in statistieken van UCLA, maar hij benadrukt dat je er geen nodig hebt om goed werk te doen.

"Het kan helpen, maar denk niet dat je weg moet gaan en nog vijf jaar naar school moet gaan om jezelf een datawetenschapper te kunnen noemen," zei Porway.

Data science is een relatief nieuw vakgebied. Dit betekent dat degenen die het veld in willen komen, het met een open geest moeten benaderen.

"Een datawetenschapper bij Foursquare gaat er heel anders uitzien dan een datawetenschapper bij Goldman Sachs", zegt Porway.

4. Rock je nieuwe rol

Bij data science draait alles om het verduidelijken van doelen, het onderzoeken van aannames, het evalueren van bewijs en het beoordelen van conclusies. Maar er is een klein stukje van de puzzel dat veel mensen over het hoofd zien. Kun je raden wat het is? Volgens Porway is het geheime ingrediënt kritisch denken.

"Het onderscheidt de hackers echt van de echte wetenschappers," zegt Porway. "Je zult versteld staan ​​hoe vaak ik iemand een model heb zien bouwen en de resultaten rapporteren zonder te beseffen dat ze niet kritisch hebben nagedacht over waar de gegevens vandaan kwamen of of hun experiment correct was ontworpen. Je moet MOET elke stap in twijfel trekken van je proces en elk nummer dat je bedenkt. "

De weg naar big data

Porway zegt dat toen hij zich realiseerde dat hij enorme hoeveelheden gegevens kon gebruiken om machines zichzelf te laten onderwijzen, het hem verbaasde. Het is die passie - en zijn opleiding en vaardigheden - die hem hebben geholpen om een ​​topbaan in de gegevenswetenschap te bemachtigen. Als je big data wilt rocken, zoek dan wat boeken, download wat data en begin met spelen. Je weet nooit wat een stapel onbewerkte gegevens zal opleveren.

Ga voor een volledig transcript van het interview naar DataScientists.Net.