Hoe werkt Data Science in de praktijk?

10 praktijkvoorbeelden van Data Science toepassingen

Artikel
Data Science

Alex de Ronde

Data Scientist

4 min

07 May 2019

Organisaties die aan de slag willen met data, vragen al snel om Data Science oplossingen. Data Science wordt namelijk vaak gezien als de heilige graal van datagedreven werken. Maar hoe ziet een succesvol Data Science project er in de praktijk nou eigenlijk uit? En wat kan het voor je organisatie betekenen? In deze reeks artikelen nemen we je mee langs alle elementen die je nodig hebt om succes te behalen voor je organisatie met Data Science.

Ter introductie vind je in dit artikel 10 praktijkvoorbeelden van succesvolle projecten uitgevoerd door de Data Science consultants van Digital Power. Gebruik ze om een beeld te vormen van Data Science is en wat het voor jouw organisatie kan betekenen.

Wat doet een Data Scientist?

Data Science toepassingen liggen op het snijvlak van kennis van wat je organisatie doet, statistiek en IT. Een Data Scientist start waar het werk van een ‘gewone’ Data Analist ophoudt. Het eindigt waar hardcore Software- of Data Engineering begint of waar statistiek en machine learning niet meer praktisch toepasbaar (en dus nutteloos) worden.

De grootste uitdagingen van Data Scientists

Voor organisaties met een goede basis infrastructuur, een heldere datastrategie en meetbare doelstellingen, kunnen Data Science oplossingen veel waarde toevoegen. De grootste uitdagingen zijn voor Data Scientists zijn dan ook om:

Te ontdekken waar en hoe ze toegevoegde waarde kunnen leveren aan een organisatie of proces
Te bepalen hoe ze de data beschikbaar én bruikbaar maken
Een Data Science model te ontwikkelen dat past bij de organisatie, zowel qua techniek als qua mensen
…en dit vervolgens te implementeren én te onderhouden!

10 praktijkvoorbeelden van Data Science toepassingen

1. Aanbevelingssysteem voor verzekeringen

Voor één van de grootste verzekeraars van Nederland ontwikkelden we een voorspellend model op basis van verschillende machine learning algoritmes. We trainden het model met behulp van historische klantcases. Het model kan bij nieuwe klanten voorspellen welke verzekeringen zij het meest waarschijnlijk willen afsluiten.

Indien vereist voorspelt het ook in welke som klasse een klant valt. Zo kan automatisch de juiste premie worden berekend en getoond. Zo kan de verzekeraar real-time aanbevelingen aan haar klanten doen.

Voor dit Data Science project werkten we met R, H2O, Python en Spotfire.

2. Visuele social media brand analyse met behulp van scraping en een voorspellend model

We werkten mee aan een grootschalig socialmedia onderzoek met als doel om inzicht te krijgen in de effecten van visuele social media posts over merken. Hiervoor hebben we een grote hoeveelheid Instagram posts/foto’s over diverse populaire merken gescraped. Deze hebben we vervolgens op basis van diverse beeldkenmerken (zowel inhoud als vormgeving) geclassificeerd.

Op basis van die classificatie bouwden we een voorspellend model dat de populariteit van merk-gerelateerde social media posts voorspelt. Het model doet dit aan de hand van beeldkenmerken van de geposte foto en eigenschappen van de degene die hem post.

We gebruikten hierbij Python en R.

3. Churn analyse voor e-commerce

Een snelgroeiend e-commerce platform besteedde veel capaciteit aan gepersonaliseerde e-mailmarketing. Het vermoeden was dat een deel van de ontvangers de mails nooit openden en/of nooit meer zouden converteren.

Wij ontwikkelden een Data Science model dat automatisch bepaalt welke klanten geen e-mails meer hoeven te ontvangen. Als bijvangst heeft dit ook waardevolle inzichten opgeleverd voor het CRM team.

Voor dit Data Science project gebruikten we R en Alteryx.

4. Verrijking database vastgoedspeler

Een verhuurmakelaar wilde op hun nieuwe website de zonligging van de tuin toevoegen aan elk object. Deze informatie was niet beschikbaar in de bestaande database. Door op een slimme manier openbare geodata te combineren, konden wij de database voor hen verrijken. Hierdoor verbetert de online informatievoorziening voor woningzoekers.

We deden dit met behulp van Python en qgis.

Meer informatie over deze case lees je hier.

5. Expected Customer Lifetime Value model voor Google Ads

Voor een e-commerce platform ontwikkelden we een model dat van iedere klant na twee weken de Expected Customer Lifetime Value bepaalt. Als input voor het model gebruikten we online data, attributie-data en orderdata. Als output geeft het model automatisch aanbevelingen voor de Google Ads strategie. Het budget wordt nu effectief besteed aan de campagnes met de hoogste omzet en positieve ROI.

Gebruikte tools en programmeertalen hierbij waren voornamelijk R en PHP.

6. Online recommender systeem

Een internationaal opererend e-commerce bedrijf wilde de omzet per websitebezoeker verhogen. We ontwikkelden een algoritme dat aan de hand van klikgedrag en de aankoophistorie van de bezoeker real-time, persoonlijk relevante productaanbevelingen doet. Hierbij koppelden we CRM data met de webshop. Na implementatie steeg de omzet per bezoeker.

We gebruikten hiervoor de Data Science tools R, Alteryx en MongoDB.

7. Optimale verdeling marketingbudget met behulp van Data Science

Voor een energiebedrijf met vaste abonnementskosten ontwikkelden we een Data Science model dat bepaalt voor welk type klant de kosten van klanten het laagst zijn. Op basis hiervan kan het marketingbudget zo efficiënt mogelijk ingezet worden.

We bouwden dit model met Alteryx.

8. Expected Customer Lifetime Value model voor budgetplanning

Ook voor budgetplanning ontwikkelden we een Data Science model, maar hiervoor was een ander soort model nodig. Hiermee kan berekend worden hoeveel het bestaande klantenbestand nog waard is. Deze informatie dient als als belangrijke input voor strategische beslissingen van de marketingafdeling.

Voor de ontwikkeling van dit model gebruikten we R.

9. Beeldherkenning voor mistdetectie

Een overheidsinstantie wilde in het kader van een pilotonderzoek kijken of mist gedetecteerd kan worden in foto’s die gemaakt zijn door snelwegcamera’s. Hiervoor trainden we state-of-the-art neurale netwerken die specifiek zijn toegespitst op beeldherkenning. De testresultaten van dit pilotonderzoek dienden als basis voor diepgaander onderzoek naar de herkenning van mist met behulp van snelwegcamera’s.

Voor dit Data Science project werkten we met R, H2O, Python en Spotfire.

10. Data Science voor planning: optimale roosters bepalen

De opdracht was om een zo goed mogelijk lesrooster te vinden voor een groot aantal studenten met ieder een individueel vakkenpakket. Het was hierbij van belang dat zo min mogelijk studenten meerdere vakken tegelijk hadden. Ook moest elk vak op een redelijke manier worden verdeeld over de week (dus niet alle lesuren van één vak op dezelfde dag).

Om zo dicht mogelijk bij het globale optimum (het beste rooster) te komen, pasten we een simulatedannealing algoritme toe.

We schreven het algoritme in Python.

Data Science projecten die waarde toevoegen aan je business

Zoals we schreven in de inleiding van dit artikel, voegen Data Science toepassingen het meeste waarde toe bij organisaties die al een solide data infrastructuur hebben staan. Hiernaast heb je een voldoende goede Data Science infrastructuur nodig indien je modellen in productie wil zetten, met correct gebruik van MLOps.

Wanneer dit niet het geval is, adviseren we om eerst in kaart te brengen hoe je de basis op orde krijgt. Ook hier kunnen we je stap voor stap bij helpen aan de hand van het Digital Power Bouwstenenmodel.

1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?

Meld je aan voor onze maillijst en blijf 'up to data':

aanmelden