Met MLOps naar volledig geautomatiseerde en betrouwbare salesvoorspellingen
Wereldwijde vermogensbeheerder
- Klantcase
- Data Engineering
Een wereldwijde vermogensbeheerder en specialist in Quant en Duurzaam Beleggen biedt beleggingsstrategieën aan, variërend van aandelen tot obligaties. Om hun concurrentiepositie te versterken en proactief in te spelen op veranderende klantbehoeften en marktontwikkelingen, wilde de sales- en marketingafdeling meer datagedreven gaan werken.
Het team voerde data-analyses uit om ad-hoc vragen te beantwoorden, en een data scientist ontwikkelde een machine learning model om salesmomenten te voorspellen. Dit model stond echter op de laptop van de data scientist, waardoor de voorspellingen op het dashboard snel verouderden en er veel handmatig werk nodig was om deze te updaten. Hoewel dit een goede eerste stap was, bood het geen toekomstbestendige oplossing.
Om een geautomatiseerd systeem te realiseren dat periodieke voorspellingen kon doen en deze direct naar het dashboard kon sturen, schakelden ze de hulp in van een van onze Data Engineers.
Aanpak
We werkten samen met de data scientist van de vermogensbeheerder via coachingsessies. Ons doel was om het bestaande model voor salesvoorspellingen te automatiseren en toekomstbestendig te maken, waarbij we MLOps-best practices gebruikten. Dit zorgt ervoor dat het model in de toekomst blijft werken en dat het eenvoudiger wordt om nieuwe modellen toe te voegen. Omdat de data scientist nauw betrokken was bij het hele proces en met coaching veel zelf kon implementeren, blijft de kennis en de MLOps-werkwijze ook binnen het bedrijf. Het proces omvatte de volgende stappen:
1. Brondata automatiseren: Allereerst wilden we de data die gebruikt werd voor het trainen van het model automatisch uit de bron halen. Een uitdaging hierbij was dat de vermogensbeheerder tegelijkertijd bezig was met het herstructureren van hun datawarehouse. Hierdoor konden we niet direct aansluiten op het datawarehouse. In plaats daarvan uploadden we de data tijdelijk automatisch vanuit het analytics systeem naar Azure. Wanneer het vernieuwde datawarehouse gereed is, kan het model daar natuurlijk direct op aansluiten.
2. Pipelines opzetten: Vervolgens maakten we twee pipelines in Azure ML en Azure DevOps. De eerste pipeline was bestemd voor het trainen van het model en de tweede pipeline voor het maken van voorspellingen. Deze tweede pipeline zorgt er ook voor dat de data automatisch op de juiste plek terecht komt voor het dashboard.
3. Code herschrijven: We herschreven de code om deze geschikt te maken voor automatisering en gebruik in de twee pipelines. We plaatsten de code ook in een Git-repository om versiebeheer en CI/CD mogelijk te maken.
We richtten de automatisering volgens de MLOps-methode in, zodat deze geschikt is voor meerdere modellen en toekomstbestendig is. Hiervoor maakten we de boilerplate code generiek, zodat de code en configuratie eenvoudig herbruikbaar zijn voor andere modellen. Dit bevordert consistentie, versnelt de ontwikkeling van nieuwe modellen, en biedt de zekerheid dat alle modellen in de toekomst in een stabiele omgeving draaien.
Resultaat
Het model is nu volledig geautomatiseerd en toekomstbestendig. Voorspellingen worden automatisch gegenereerd en direct opgenomen in het dashboard, wat veel handmatig werk bespaart. Het enige handmatige proces dat nog resteert, is de goedkeuring van het model na de training. Deze laatste controle door een persoon blijft belangrijk om de kwaliteit te waarborgen.
Daarnaast heeft de data scientist aanzienlijk meer kennis opgedaan over data engineering en MLOps. Dit stelt haar in staat om deze vaardigheden in de toekomst meer zelfstandig toe te passen, en betekent ook dat de kennis binnen de organisatie gewaarborgd blijft.
Toekomst
In de toekomst zetten we de samenwerking met de data scientist van de vermogensbeheerder voort om een volgend model te ontwikkelen voor een andere toepassing. Aangezien dit model vanaf nul moet worden ontwikkeld, zullen we starten met data science en het vervolgens in dezelfde structuur gieten om het te automatiseren. Doordat het eerste model op de juiste MLOps-manier is opgezet, zal dit een stuk efficiënter verlopen.
Meer weten?
Joachim gaat graag met je in gesprek over wat we als datapartner voor jou en je organisatie kunnen betekenen.
Business Manager020 308 43 9006 23 59 83 71joachim.vanbiemen@digital-power.com
1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?
Meld je aan voor onze maillijst en blijf 'up to data':