Hoe vind je een geschikte data scientist?

Inzichten en tips voor het vervullen van je data science vacature

  • Artikel
  • Data Science
Alex-data-scientist
Alex de Ronde
Data Scientist
8 min
08 Oct 2019

Steeds meer organisaties gaan aan de slag met Data Science. Logischerwijs neemt het aantal vacatures flink toe. Maar hoe stel je een bruikbare functieomschrijving op voor een Data Scientist - en vooral: hoe kies je de juiste? In dit artikel lees je wat je moet doen, en wat níet.

Waarom het moeilijk is om de juiste Data Scientist voor je organisatie te vinden


Recruiters en managers weten over het algemeen niet echt wat ze met Data Science aan moeten. Zelfs mensen uit vakgebieden als IT en Business Intelligence hebben er vaak moeite mee. Vaak is een vacature voor Data Science een hoofdpijndossier. Dit wordt bewezen en vervolgens versterkt door het feit dat bedrijven moeite hebben om toegevoegde waarde uit Data Science te halen. Slechts 62% van de bedrijven geeft aan waarde te halen uit hun investeringen in Big Data en AI.

In de praktijk komt het grotendeels neer op twee redenen:

  • Organisaties weten niet waar de toegevoegde waarde zit
  • Ze hebben niet de juiste (data)infrastructuur

Dat is een probleem voor zowel de Data Scientist die een baan zoekt, als voor het bedrijf dat zichzelf wil verbeteren. Dit leidt er regelmatig toe dat de verkeerde persoon op de verkeerde plaats terecht komt op het verkeerde moment. En hoewel er geen eenvoudige oplossing bestaat, kunnen we je helpen de basis op orde te krijgen.

"Na enkele jaren in de sector actief geweest te zijn als specialist, afdelingshoofd, en nu als consultant, valt het me steeds meer op hoeveel moeite recruiters, HR-mensen en managers hebben om de juiste data scientists aan te nemen. "


- Alex de Ronde, Data Science consultant, Digital Power


Wat organisaties in een Data Scientist zoeken

Om erachter te komen wie je moet werven en hoe, moet je eerst bedenken wát je eigenlijk nodig hebt. Data science zit op het snijvlak van (wiskundig) modelleren, IT, en organisatie of domeinkennis. Data Scientists gebruiken dus allerlei wiskundige of technische technieken om dingen te doen waar de organisatie concreet iets aan heeft. Hier kun je echter je nog alle kanten mee op. Daarom zijn er ook veel verschillende typen Data Scientists die bij verschillende use cases horen. We zetten de belangrijkste op een rij.

De belangrijkste typen Data Scientists

De Advanced Analytics-goeroe is iemand die meer kan dan een 'gemiddelde' analist. Deze persoon kan de meest complexe analyses aan en heeft de knowhow om de data te verkrijgen en om te zetten in bruikbare visualisaties. Een Advanced Analist heeft aanzienlijke statistische kennis en waarschijnlijk enige technische achtergrond of is autodidact, maar hoeft geen Data Engineer of statistisch genie te zijn. In feite hoeft deze persoon "alleen maar het model aan de praat te krijgen", bij voorkeur het eenvoudigste model dat het werk doet. Vaak zal deze rol de eerste zijn die je nodig hebt in je reis naar datagedreven of AI-aangedreven zijn, omdat deze in korte tijd veel waarde kan leveren.

Het tweede type is iemand die end-to-end data science-oplossingen kan bouwen, waaronder de engineering om een model op een server te laten draaien en live resultaten te geven. Dit is een profiel dat meer technisch en wiskundig georiënteerd is, aangezien beide nodig zijn om modellen betrouwbaar en goed te laten werken in een meer geavanceerde context. Een valkuil die je vaak ziet in vacatures is dat men werft voor dit profiel, terwijl deze vaardigheden eigenlijk niet nodig zijn. Dat is jammer, want deze mensen die meer technisch en wiskundig gericht zijn, zijn vaak minder geïnteresseerd in het begrijpen van je klanten of logistiek, wat kan leiden tot een slechte fit.

Een mooi voorbeeld dat het verschil tussen deze profielen laat zien is wanneer je aan personalisatie doet, een hot item in de markt. Bedrijven die personalisatie met succes toepassen, gaan meestal eerst over tot segmentatie, en dan pas tot personalisatie. Geavanceerde analytics-experts begrijpen de klant en staan dicht bij marketeers en managers, zodat ze in de data kunnen duiken, precies begrijpen wat er gebeurt, en algoritmen en statistieken kunnen gebruiken om potentiële segmenten te bepalen en te testen. Na verloop van tijd zul je van algemene segmenten willen overstappen op specifiekere, kleinere segmenten in specifieke omstandigheden. Op een gegeven moment kan een mens die niet meer aan en dan heb je de end-to-end data science oplossingen nodig met de juiste Machine Learning Ops om deze beslissingen automatisch en real-time te nemen, waarvoor je het tweede type met een andere focus en skillset nodig hebt.

Er bestaan meer verschillende specifieke Data Science rollen:

  • De Analytics Translator begrijpt Data Science maar bouwt zelf geen modellen; deze persoon helpt mensen uit de business of operations de data/tech-kant te begrijpen en vice-versa, en fungeert als de lijm die de machine bij elkaar houdt en miscommunicatie voorkomt.
  • Een Machine Learning Engineer is een soort end-to-end Data Scientist, maar richt zich puur op de technische kant. Dit wordt relevant in situaties waarin je buitengewone eisen stelt aan de latentie of de verwerkingscapaciteit (denk aan banken), of wanneer je veel data science modellen naast elkaar hebt draaien.
  • Er bestaan ook deskundigen op specifieke deelgebieden, zoals iemand die gespecialiseerd is in computer vision of natural language processing. We kunnen hier niet op al deze types ingaan.

Hoe meer specialistische kennis, hoe beter? Think again!

Naast (technische) vaardigheden is senioriteit ook belangrijk. Hier wordt dan ook vaak om gevraagd in vacatures. Bedenk hierbij dat juist het sóórt senioriteit essentieel is om van data science een succes te maken. De moeilijkheid is in veel organisaties niet om iets technisch te bouwen – dit kan met tools en mensen opgelost worden – maar om het in de organisatie als geheel te implementeren.

Kunnen je eindgebruikers ook echt werken met wat je voor ze bouwt? En welk proces volgen we om te bepalen of een model na een half jaar nog up to date is?

Senioriteit op het gebied van data science gaat dus níet enkel om specialisme in het technische domein, maar om overzicht, organisatiekennis en leiderschap. Dit neemt natuurlijk niet weg dat specialisten enorm waardevol zijn wanneer ze op de juiste plaats, het juiste moment en op de juiste manier ingezet worden.

De 3 belangrijkste selectiecriteria bij de zoektocht naar een Data Scientist

Tenzij specifieke toolkennis absoluut noodzakelijk is, selecteer je de meest geschikte Data Scientist dus op:

  • Type: what kind of actual work will this person do, and do you need a specialist?
  • Mate van senioriteit: zoek je iemand met veel jaren werkervaring of kies je voor een recent afgestudeerde data scientist die opgeleid met de meest recente ontwikkelingen in het vakgebied?
  • All the other requirements you have! Such as culture fit and personality.

Zorg ervoor dat je deze criteria duidelijk vermeldt in je vacature. Zo voorkom je teleurstellingen voor beide partijen.

Hoe ziet jouw vacature voor een Data Scientist eruit?

Onze vraag aan jou als lezer is nu of je de meest geschikte Data Scientist voor je organisatie kunt vinden met gebruikelijke manier:

Je checkt bijvoorbeeld voor ‘een data science rol’ op minimaal 3 jaar (relevante) werkervaring, moet ervaring hebben met én R, én Python, én cloud, én Spark, én MLOps, en waarom niet nog een paar. Verder test je voor keywords, minimaal een afgeronde master econometrie (maar eigenlijk een PhD), 2 jaar ervaring in de financiële sector, en ‘moet helemaal enthousiast worden van spitten in een grote bak (ongestructureerde) data’.

Naar welke rol zoek je dan hier? Vraag jezelf dit eens af en kijk nog eens kritisch naar je vacature voor een Data Scientist.

Vind een geschikte Data Scientist

Natuurlijk hebben we bij Digital Power ons best gedaan en fouten gemaakt. We hebben, achteraf gezien, soms een goede kandidaat niet aangenomen, maar op deze manier hebben we wél een data science team gebouwd waar veel organisaties alleen maar van kunnen dromen.

Met de ouderwetse methode hadden we dit team zeker niet kunnen samenstellen. Ben je op zoek naar een geschikte Data Scientist? Vraag jezelf dan het volgende: wil je iemand die voldoet aan je checklist, of wil je de persoon die je nodig hebt?

We denken graag met je mee over hoe je dit aanpakt. Neem contact met ons op of je hierover wilt sparren.

Dit is een artikel van Alex de Ronde, Data Science Consultant, Digital Power

Alex is een all-round Data Scientist met leiderschapservaring bij meerdere organisaties en een passie voor pragmatische strategie. Hij helpt klanten bij het zien van het gehele plaatje, vinden van mogelijkheden, en zet deze om in concrete resultaten.

Alex de Ronde

Data Scientist

1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?

Meld je aan voor onze maillijst en blijf 'up to data':