Moet je LLM’s lokaal draaien?
When local AI models outperform API-based services
- Artikel
- AI & Data Science
- Data Engineering


Large Language Models (LLMs) zijn in korte tijd een standaard onderdeel geworden van moderne applicaties. De meeste teams starten met het integreren van modellen zoals OpenAI of Claude via API’s. Dat is snel, eenvoudig en vereist weinig infrastructuur.
Maar wat gebeurt er als:
- API-kosten stijgen?
- Modellen onverwacht veranderen?
- Je met gevoelige data werkt die je omgeving niet mag verlaten?
Voor organisaties die werken met proprietary data, hoge volumes of strikte compliance-eisen, wordt het draaien van open-source LLMs lokaal een steeds aantrekkelijker alternatief.
In dit artikel leggen we uit wanneer lokale LLM deployment zinvol is, hoe je begint en welke infrastructuur nodig is om van experiment naar productie te gaan.
Voor de leesbaarheid en vanwege gangbare terminologie binnen het vakgebied is de rest van dit artikel in het Engels geschreven.
Why not just use API-based LLMs?
API services such as OpenAI or Anthropic offer powerful models that are easy to integrate. For many use cases, they remain the simplest option.
However, there are situations where local models offer clear advantages.

When running LLMs locally becomes attractive
Local deployment becomes particularly valuable when:
- You process sensitive or regulated data
- Usage volumes become large and predictable
- API costs grow significantly
- You need stable and reproducible model behaviour
Understanding local LLM deployment
Running LLMs locally involves several components. To simplify the landscape, we divide the process into five key areas:
- Local development tools
- Interfaces and user experience
- Model selection and performance
- Deployment infrastructure
- Cost considerations
1. Local development tools
Before deploying models in production, you will typically start by testing them locally. Two tools make this particularly straightforward:

Both tools allow you to prototype locally before committing to production infrastructure.
In practice, LM Studio is often preferred for quick testing, while Ollama offers more flexibility for automation and integration.
2. Interface and user experience
Once models run locally, you need a way to interact with them.
While LM Studio and Ollama include basic chat interfaces, many teams prefer a dedicated interface layer.
Open WebUI provides a modern web interface similar to ChatGPT, but connected to your own models.
Key capabilities:
- Connect to multiple model backends
- Compare model responses side-by-side
- Share access with team members
- Manage conversation history
- Upload documents for context
This makes it especially useful when you want to give non-technical colleagues access to local AI tools.
3. Model selection and performance
Choosing the right model is essential when running LLMs locally. Model size is typically measured in parameters (billions).

For many organisations, mid-size models around 70B parameters provide the best balance between performance and infrastructure cost. Smaller models can handle high-volume, simpler tasks, while larger models are typically reserved for specialised workloads where maximum capability is required.
4. Deployment and infrastructure
Once you move beyond experimentation, you need infrastructure capable of serving models reliably.
Running models locally
Your own laptop or workstation is often sufficient for development.
This works well when:
- testing integrations
- experimenting with prompts
- running smaller models
Deploying to GPU virtual machines
For production workloads, a GPU-enabled VM is typically required.
This is necessary when:
- multiple users access the model
- uptime and reliability are important
- larger models require more VRAM
- higher throughput is required
Typical deployment setup
A common architecture includes:
- GPU VM
- Ollama running the model
- Nginx reverse proxy
- client applications connecting via API
This setup provides an OpenAI-compatible endpoint that you control entirely.
5. Cost considerations
There are generally three ways to serve LLMs:

When does local deployment make sense?
Local models are particularly valuable when:
- Workloads are high volume and predictable
- Batch processing tasks analyse large datasets
- Multiple use cases share the same infrastructure
- Data privacy requirements prevent external sharing
Many organisations adopt a hybrid strategy, combining local models with external APIs depending on the task.
Conclusion
Running open-source LLMs locally gives organisations significantly more control over their AI infrastructure.
You gain:
- full data privacy
- predictable infrastructure costs
- independence from API rate limits
- stable model behaviour in production
For teams exploring this approach, a practical path forward is:
- Start small
- Experiment locally using tools such as LM Studio or Ollama.
- Choose the right model
- Match model size to the complexity of your task.
- Scale thoughtfully
When moving to production, evaluate whether a budget GPU provider or a major cloud platform fits your architecture best.
Local LLMs are not always the right solution, but for many organisations they give greater flexibility, control and cost efficiency in modern AI systems.
Dit is een artikel van Bob Strube
Bob is Data Engineer bij Digital Power en specialiseert zich in AI en schaalbare dataplatformen. Hij heeft machine learning- en GenAI-oplossingen gebouwd en uitgerold op Azure en Databricks. Hij helpt organisaties om van experiment naar productie te gaan met betrouwbare, kostenefficiënte en privacyvriendelijke infrastructuur.
1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?
Meld je aan voor onze maillijst en blijf 'up to data':
Misschien vind je dit ook leuk
Snellere AI-zoekresultaten met een schaalbare streaming data pipeline
Exa is een AI-bedrijf dat een zoekmachine en API ontwikkelt waarmee AI-systemen het internet slim kunnen doorzoeken en analyseren. Hun technologie wordt toegepast binnen verschillende domeinen, zoals finance, coding agents, nieuws, recruitment en consulting. Hierbij worden grote hoeveelheden online data snel gevonden, gestructureerd en samengevat voor specifieke use cases.
Waarom moderne data-architectuur een organisatievraagstuk is
De vraag is niet meer hoe je data technisch ontsluit, maar hoe je je organisatie inricht om er structureel waarde mee te creëren. Tijdens het DWH & BI Summit in maart 2026 kwamen data leaders, architecten en governance‑experts samen om te praten over data mesh, data governance, data products en data modeling.
Het ontwerpen van waardevolle ML-systemen
Machine learning (ML) wordt vaak gezien als een modelleerproces. Je kiest een algoritme, traint het, evalueert de statistieken en implementeert het. In werkelijkheid is de keuze voor het algoritme een van de minst belangrijke beslissingen die je neemt.
Tealium Digital Velocity: AI in de praktijk
Voor professionals in data, analytics, martech en customer experience is Digital Velocity een van de evenementen waar ontwikkelingen concreet worden. Het brengt practitioners, partners en industry leaders samen om te laten zien hoe zij AI, real-time data en customer experience in de praktijk aanpakken.
Minder administratietijd in de gezondheidszorg dankzij veilige AI-gespreksrapportage
Dedimo wilde ontdekken hoe AI kon helpen om behandelgesprekken tussen client en behandelaar automatisch te transcriberen en rapportages te genereren.
4× snellere personalisatie met een composable CDP (Databricks deepdive)
Transavia opereert in een sterk competitieve reismarkt waarin klanten steeds hogere verwachtingen hebben van persoonlijke en consistente communicatie. Of het nu gaat om de website, de app of e-mail: elke interactie moet aansluiten op gedrag en voorkeuren.
Direct inzicht in sensordata met een self-service analytics platform
Heerema Marine Contractors opereert ’s werelds grootste kraanschepen, uitgerust met een enorme hoeveelheid sensoren die samen miljoenen metingen per dag produceren. Deze sensordata is cruciaal voor veiliger werken, lagere emissies, betere engineering en onderbouwde investeringsbeslissingen.
Hoe AI programeren verandert: Van autocomplete naar agentic coderen
Kunstmatige intelligentie verandert de manier waarop je digitale oplossingen ontwerpt, bouwt en onderhoudt. Van codegeneratie tot het automatiseren van datapijplijnen, AI is een vertrouwde partner geworden in technische workflows.
Meer grip op AI-initiatieven met ondersteuning van een Analytics Translator
Toen de vaste Analytics Translator van een dienstverlenende organisatie met zwangerschapsverlof ging, schakelde het team onze hulp in om de lopende AI-projecten soepel door te laten lopen. Tegelijkertijd wilde de organisatie graag een frisse, externe blik: hoe werd de rol ingevuld en waar viel nog winst te behalen?
Dataplatform audit biedt helder inzicht en concrete optimalisaties
Volero.nl is een jong en snelgroeiend bedrijf dat vloerkleden verkoopt via een webshop en fysieke winkel. Ze zijn voornamelijk actief in Nederland, maar groeien hard in Europa, onder andere in België, Duitsland en Polen. Om deze groei te ondersteunen, is het voor Volero belangrijk om datagedreven te werken.
Slimme tekstanalyse: hoe onze AI-tool snel grote hoeveelheden data categoriseert
Het analyseren van honderden of duizenden open antwoorden uit surveys, interviews of reviews is tijdrovend. Om die antwoorden beter te begrijpen, brengen we ze onder in thema’s (bijvoorbeeld gebruiksgemak, service, levering of betrouwbaarheid). Bij Digital Power gebruiken we Large Language Models (LLM’s) om grote hoeveelheden open antwoorden snel te categoriseren. Ons team bouwde zelf een veilige, transparante tool waarmee we precies weten wat er gebeurt. Maar is AI al zo ver dat het onze menselijke onderzoekers kan vervangen?
Van ambitie naar activatie: hoe Ennatuurlijk met data echt in beweging kwam
Bij energiebedrijf Ennatuurlijk groeide de overtuiging dat intuïtie niet langer genoeg was om de koers te bepalen. De energiemarkt verandert snel, de organisatie groeit, en de hoeveelheid informatie neemt elke dag toe. IT Manager Eric Vanderfeesten ging op zoek naar een datapartner die niet alleen strategisch kon adviseren op het gebied van datagedreven werken, maar zijn datateam ook op operationeel vlak kon versterken. In dit interview deelt hij zijn visie, ervaring en resultaten uit de samenwerking met Digital Power.
Hoe migreer je je data warehouse?
Als je hebt besloten je datawarehouse naar een Europese omgeving te migreren, is een gestructureerde aanpak cruciaal. Deze blog richt zich op de stappen die nodig zijn voor een soepele en succesvolle overgang.
Download: Migratiegids voor moderne data warehousing
Deze Engelstalige gids is bedoeld als leidraad bij de migratie van legacy datawarehouses of databases naar moderne Lakehouse-oplossingen zoals Databricks en Snowflake. Het beschrijft de verschillende stappen die nodig zijn voor een gestructureerd migratieproces. Migraties zijn vaak complexe processen die zorgvuldig moeten worden gepland en uitgevoerd om een soepele overgang te garanderen.
Welke Europese data warehouse oplossingen zijn beschikbaar?
Door geopolitieke ontwikkelingen en toenemende zorgen over datasoevereiniteit onderzoeken steeds meer organisaties hoe zij hun afhankelijkheid van Amerikaanse cloudproviders kunnen verminderen.
Is jouw organisatie klaar voor onafhankelijkheid van de VS en de overstap naar EuroStack?
In een tijdperk van internationale spanningen en groeiende zorgen over privacy, veiligheid en technologische soevereiniteit, heroverweeg jij misschien je afhankelijkheid van Amerikaanse technologische oplossingen. De drang naar digitale onafhankelijkheid is niet alleen een politiek doel, maar ook vaak een pragmatische zakelijke noodzaak.
AI, GenAI, ML en MLOps uitgelegd
Artificial Intelligence (AI) verandert de manier waarop organisaties opereren. Van gepersonaliseerde klantervaringen tot geautomatiseerde of ondersteunde besluitvorming, AI helpt jouw organisatie data optimaal te benutten. Toch kan het navigeren door dit snel evoluerende vakgebied overweldigend zijn. Termen zoals AI, Generative AI (GenAI) en Machine Learning (ML) zorgen vaak voor verwarring.
AI agents ontrafeld
Met de voortdurende ontwikkelingen in de data- en AI-industrie lijkt de hype rond AI-agents niet te vertragen. Jensen Huang, CEO van Nvidia, is een groot voorstander van AI-agents en ziet een miljardenkans voor zich, waarbij agents taken kunnen uitvoeren met een hoge mate van autonomie en een revolutie teweeg kunnen brengen in hoe mensen en bedrijven werken. In dit Engelstalige artikel bespreken we wat AI-agents precies zijn, wat hun belangrijkste componenten zijn, hoe ze samenwerken en hoe je er een kunt bouwen.
In 3 stappen naar effectieve data governance
In dit tweedelige artikel duiken we in het belang van data governance en bieden we een praktische gids voor implementatie binnen jouw organisatie. In het eerste deel bespraken we waarom je niet langer kunt wachten met data governance. Nu richten we ons op hoe je dit stapsgewijs kunt aanpakken.
Waarom je niet langer kunt wachten met data governance
In een tijd waarin data de kern vormt van bedrijfsvoering en innovatie, is het uitstellen van data governance geen slimme zet. In dit artikel leggen we uit waarom je nú in actie moet komen om grip te krijgen op je data, risico’s te beperken en een voorsprong op de concurrentie te behouden.
Waarom het voor organisaties nú belangrijk is om in AI-trainingen te investeren
Veel organisaties voelen de druk: AI lijkt overal ineens hoog op de agenda te staan. Nieuwe tools volgen elkaar razendsnel op, collega’s experimenteren met ChatGPT, klanten stellen slimmere vragen en in de media is het woord ‘AI’ niet meer weg te denken. Het voelt alsof er een trein is vertrokken, en niemand wil achterblijven.
Hoe een start-up begint met datagedreven werken
Een innovatieve start-up in de babybranche wilde datagedreven werken om waardevolle inzichten te verkrijgen en strategisch te kunnen groeien. Ze schakelden onze hulp in om deze ambitie waar te maken.
Hoe bouw je een sterk cloud governance framework op?
Werk je steeds meer in de cloud? Dan is het tijd om na te denken over governance. Met duidelijke afspraken en controles houd jij grip op je cloudomgeving – van kosten en security tot compliance. Zo voorkom je beveiligingsproblemen, onnodige uitgaven of het niet voldoen aan compliance-eisen.
Webinar | Machine Learning operations framework
Je hebt een datawarehouse en modellen ontwikkeld waarvan bewezen is dat ze waardevolle conclusies genereren, maar de zakelijke impact is er nog niet? In deze webinar laten we zien hoe het juiste framework deze modellen binnen enkele minuten kan activeren om continu actuele voorspellingen te leveren. Dit is het centrale doel van MLOps.
Van strategie naar realisatie: een datagedreven toekomst
Ennatuurlijk levert duurzame warmte en koude via warmtenetten aan consumenten en bedrijven. Het interne team Data & Analytics heeft de taak om de organisatie datagedreven te laten werken. Hierbij liepen ze tegen een uitdaging aan: de vele aanvragen voor dataproducten binnen de organisatie waren moeilijk te managen en de impact bleef beperkt. Het managementteam vroeg ons daarom te helpen met het ontwikkelen van een datastrategie, het creëren van een toekomstbestendig datalandschap en het aanjagen van een datagedreven mindset binnen de organisatie.
400% snellere time-to-market voor nieuwe personalisatie use cases
In september 2023 vroeg Transavia ons om hun Customer Data Platform (CDP) te evalueren: sloot het nog aan bij hun marketingdoelen en was het toekomstbestendig met de strengere regels rondom third-party cookies?
Webinar | Hoe Transavia haar klantdata samenvoegde via een composable customer data platform (CDP)
Of je nu bij een groot modemerk, supermarkt of in de reisindustrie werkt, het benutten van je klantdata om klantervaringen te personaliseren is cruciaal voor je succes. Maar het is niet eenvoudig om dit voor elkaar te krijgen. Net als de meeste B2C-bedrijven zwemmen luchtvaartmaatschappijen in de klantinformatie die afkomstig is van tientallen verschillende plaatsen en worstelen ze met de kwaliteit van de gegevens, de naleving van de privacywetgeving en realtime personalisering.
Wat is een composable CDP en waarom is het de toekomst?
Steeds meer bedrijven lopen tegen de beperkingen van traditionele Customer Data Platforms (CDP's) aan: ze missen flexibiliteit, hebben moeite met het importeren en exporteren van data, en worstelen om te voldoen aan de strenge privacywetgeving.
Gepersonaliseerde marketing met een composable CDP
Om écht klantgericht te werken, is een flexibele en krachtige tech stack essentieel. Klanten verwachten relevante, gepersonaliseerde interacties op het juiste moment en via het juiste kanaal. Met de juiste technologieën zorg je ervoor dat elke klant zich begrepen voelt en optimaliseer je je marketinginspanningen.
Schaalbare machine learning-modellen dankzij implementatie MLOps-framework
Nadat we een data warehouse voor Meerlanden hadden gebouwd, ging hun data scientist met de data aan de slag. We stelden voor om samen een Machine Learning Operations framework op te zetten waarin hij zijn modellen direct kon integreren in de bestaande omgeving. Zo kon hij voorspellingen doen die de dienstverlening van Meerlanden efficiënter maken.
Implementatie van AI-toepassingen die businesswaarde opleveren
Sinds de lancering van ChatGPT zijn steeds meer organisaties bezig met de vraag: ‘Hoe kunnen we AI toepassen binnen onze organisatie?’ Ook bij deze hotelketen gebruiken medewerkers al op eigen initiatief AI-toepassingen en zien ze de potentie om dit breder in te zetten. Ze zochten naar pragmatische toepassingen van AI specifiek voor hun domein en een aanpak die zich richt op het creëren van businesswaarde. De hotelketen ging in gesprek met meerdere partijen en koos ervoor met ons aan de slag te gaan. Onze pragmatische aanpak gaf hierbij de doorslag.
Wat is data governance?
Naarmate het gebruik van data in organisaties steeds gebruikelijker wordt, neemt de noodzaak om controle over je data te behouden steeds meer toe. Controle krijgen over je data wordt bereikt door effectieve data governance. Veel mensen hebben echter moeite om te begrijpen wat data governance precies inhoudt en hoe ze dit in hun organisatie kunnen implementeren. Dit artikel heeft als doel je een overzicht te geven van de cruciale componenten van data governance en hoe je deze in je organisatie kunt introduceren.
Machine Learning-inferentie optimaliseren met PySpark en Pandas UDF's
In de wereld van machine learning kan het werken met grote datasets en complexe modellen al snel tijdrovend en resource-intensief worden. Om dit proces te versnellen is parallellisatie cruciaal. Deze techniek bestaat uit het opsplitsen van taken in kleinere subtaken die gelijktijdig verwerkt kunnen worden op meerdere CPU cores of gedistribueerde machines binnen een cluster. Door de werklast te spreiden, kun je data sneller en efficiënter verwerken op grote schaal.
Effectiever verkopen dankzij voorspelling van kans op leadconversie
Talent Garden biedt masterclasses en trainingsprogramma's aan studenten en komt met hen in contact via verschillende touchpoints. Online touchpoints bestaan uit ingevulde contactformulieren en informatieverzoeken, terwijl offline touchpoints bestaan uit ontmoetingen en gesprekken met het verkoopteam van Talent Garden. Tijdens het gehele klantreis, van het eerste contact tot de uiteindelijke inschrijving, verzamelt Talent Garden veel data*. Met een schat aan ruwe data tot hun beschikking wilden ze het inschrijvingsproces en de effectiviteit van hun verkoopteam verbeteren. Om dit te bereiken, vroegen ze ons een datasciencemodel te ontwikkelen dat beter kan voorspellen hoe groot de kans is dat een nieuwe lead zich inschrijft voor een studie.
Met MLOps naar volledig geautomatiseerde en betrouwbare salesvoorspellingen
Een wereldwijde vermogensbeheerder en specialist in Quant en Duurzaam Beleggen biedt beleggingsstrategieën aan, variërend van aandelen tot obligaties. Om hun concurrentiepositie te versterken en proactief in te spelen op veranderende klantbehoeften en marktontwikkelingen, wilde de sales- en marketingafdeling meer datagedreven gaan werken.
Een schaalbaar datamodel voor de analytics van meerdere websites
Een digitaal bureau ontwikkelt en beheert diverse websites en analyseert de prestaties hiervan met Google Analytics, waarbij de resultaten via dashboards met klanten worden gedeeld. De overgang van Universal Analytics naar GA4 zorgde echter voor problemen, omdat de data in GA4 anders is gestructureerd en de bestaande dashboards hierdoor niet meer functioneerden. Het bureau vroeg ons mee te denken over een schaalbare en toekomstbestendige oplossing die voor al hun klanten toepasbaar is.
Wat is social listening?
Het internet staat bomvol interessante social media posts, likes en shares. Een schat aan informatie, zeker voor organisaties die online meer impact willen maken. Maar waar begin je? Welke data ga je verzamelen, hoe ga je die analyseren en hoe kan je inzichten omzetten in concrete actiepunten? Om deze vragen te beantwoorden, is het belangrijk om bij de missie en doelen van de organisatie te beginnen.
Duurzame groei door komst datateam
Snelgroeiende scale-up EnergyZero had vanwege hun extreme groei behoefte aan het uitbouwen en het neerzetten van een sterk datateam. Hierbij was de eerste databehoefte het ondersteunen en uitvoeren van de financiële analyse t.b.v. een opkomende audit. Daarnaast wilde ze werkprocessen automatiseren en de data-uitwisseling met B2B-partners verbeteren.
Low-code/no-code versus zelf coderen
Jaren geleden kon je geen applicatie of proces ontwikkelen zonder kennis van complexe programmeertalen als Javascript, PHP, en Python. Je had een programmeur of Data Engineer nodig. Vandaag de dag is er een tekort aan technische experts, terwijl er steeds meer low-code oplossingen op de markt verschijnen. Deze tools stellen je in staat om zonder diepgaande technische kennis aan de slag te gaan. Of dit de juiste oplossing voor jou is, hangt van verschillende factoren af. Maak de juiste beslissing met behulp van dit artikel.
Wat doet een (Cloud) Data Engineer versus een Machine Learning Engineer?
In de wereld van data en technologie zijn Data Engineers en Machine Learning Engineers cruciale spelers. Beide rollen zijn essentieel voor het ontwerpen, bouwen en onderhouden van moderne data-infrastructuren en geavanceerde machine learning (ML) toepassingen. In deze blog focussen we specifiek op de taken en verantwoordelijkheden van een Data Engineer en Machine Learning Engineer.
De organisatorische voordelen van het implementeren van je eigen AI-chatbot
Met de toenemende beschikbaarheid van clouddiensten die bedrijven in staat stellen Large Language Models te benutten, wordt het relatief eenvoudig om je eigen GPT-model op te zetten. Maar wat zijn de voordelen hiervan voor je organisatie?
Hoe werkt de AI Document Explorer in de praktijk?
De AI Document Explorer (AIDE) is een cloudoplossing, ontwikkeld door Digital Power, die gebruik maakt van het OpenAI’s GPT-model. Je kunt het inzetten om snel inzicht te krijgen in bedrijfsdocumenten. AIDE indexeert jouw bestanden op een veilige manier waardoor het mogelijk wordt om vragen te stellen over jouw eigen documenten. Niet alleen geeft het jou de antwoorden waar je naar op zoek bent, het geeft ook de referenties naar de plekken waar deze antwoorden staan.
Snelle en betrouwbare interne informatie met behulp van AI Document Explorer
Financiële instellingen moeten grote hoeveelheden documentatie verwerken. Voor deze specifieke instelling faciliteert een intern team dit door bijvoorbeeld samenvattingen te maken met behulp van tekstanalyse en natural language processing (NLP). Deze maken ze beschikbaar voor de verschillende business units. Om audits efficiënter uit te voeren, wilden ze een vraag- en antwoordmodel ontwikkelen om sneller de juiste informatie tot hun beschikking te hebben. Toen ChatGPT werd gelanceerd, vroegen ze ons een proof of concept te maken.
Een dataplatform implementeren
Deze blog is bedoeld om onze kennis en ervaring over te dragen aan de gemeenschap door richtlijnen te beschrijven voor de implementatie van een dataplatform in een organisatie, gebaseerd op onze knowhow. We weten dat de specifieke behoeften van elke organisatie anders zijn, dat ze een impact zullen hebben op de gebruikte technologieën en dat één enkele architectuur die aan al deze behoeften voldoet, niet realistisch is. Daarom houden we het in deze blog zo algemeen mogelijk.
Efficiënter werken dankzij migratie naar Databricks
Het Kadaster beschikt onder andere over complexe (geo)data van al het vastgoed in Nederland. Alle data wordt opgeslagen en verwerkt via een on-premise data warehouse in Postgres. Voor het onderhoud van dit warehouse zijn ze afhankelijk van een IT-partner. Het Kadaster wil kosten besparen en efficiënter gaan werken door te migreren naar een Databricks-omgeving. Ze vroegen ons te helpen bij de implementatie van dit data lakehouse in Microsoft Azure Cloud.
Kwalitatieve onderzoekers vervangen door AI, een goede beslissing?
Artificial Intelligence lijkt alles te kunnen, en soms zelfs beter en sneller dan dat we het zelf kunnen doen. Het analyseren van kwalitatieve data is een tijdrovende klus, waarvan we als onderzoekers nieuwsgierig zijn of het sneller en gemakkelijker kan. Biedt AI hiervoor een oplossing? Onze onderzoekers zochten het uit.
Breng structuur aan in je data
Er zijn veel verschillende vormen van dataopslag. In de praktijk worden een (relationele) database, een datawarehouse en een data lake het meest gebruikt én door elkaar gehaald. In dit artikel lees je wat ze inhouden en hoe je ze gebruikt.
Miljarden streams omgezet in bruikbare inzichten met een nieuw data- en analytics platform
Merlin is de grootste digitale muzieklicentiepartner voor onafhankelijke labels, distributeurs en andere rechthebbenden. De leden van Merlin vertegenwoordigen 15% van de wereldwijde markt voor muziekopnames. Het bedrijf heeft overeenkomsten met Apple, Facebook, Spotify, YouTube en 40 andere innovatieve digitale platforms over de hele wereld voor de opnames van haar leden. Het team van Merlin volgt betalingen en gebruiksrapporten van digitale partners nauwlettend en zorgt ervoor dat hun leden nauwkeurig, efficiënt en consistent worden betaald en van rapportages worden voorzien.
Cloudmigratie: hoe werkt dit in de praktijk?
Vroeger werd alle data van bedrijven lokaal opgeslagen in een on-premise omgeving. Steeds meer bedrijven migreren hun data-infrastructuur naar de cloud. Cloud computing maakt gebruik van servers die door cloud service providers als Amazon Web Services, Microsoft Azure en Google Cloud Platform worden beheerd en onderhouden. In dit artikel lees je de antwoorden op de vragen die je zult hebben als je een cloudmigratie overweegt.
Wat is machine learning operations (MLOps)?
Het in productie nemen van machine learning modellen blijkt in de praktijk een complexe taak. MLOps helpt organisaties die zelf modellen willen ontwikkelen en onderhouden bij het borgen van de kwaliteit en continuïteit. Lees dit artikel en krijg antwoord op de meest gestelde vragen over dit onderwerp.
Webinar: Data Governance
In dit webinar bespreken we het maturity model dat we toepassen om de volwassenheid van verschillende dimensies van data governance te kwantificeren. Daarnaast geven we concrete stappen en implementatietips om te beginnen met het leveren van toegevoegde waarde door datamanagement.
20% minder klachten dankzij datagedreven onderhoudsrapportages
Een belangrijk onderdeel van de bedrijfsvoering van Otis is het onderhoud van hun liften. Om dit goed te timen en klanten proactief te informeren over de status van hun lift, wilde Otis continue monitoring inzetten. Ze zagen veel potentie in predictive maintenance en onderhoud op afstand.
Waardevolle inzichten uit Microsoft Dynamics 365
Agrico is een coöperatie van aardappeltelers. Zij telen aardappels voor verschillende doeleinden zoals consumptie en het planten van toekomstige oogsten. Deze aardappels worden wereldwijd geëxporteerd via verschillende dochterondernemingen. Alle logistieke en operationele data wordt opgeslagen in hun ERP-systeem Microsoft Dynamics 365. Omdat dit systeem met zijn vele features erg complex is, is de data niet direct geschikt om te gebruiken voor rapportages. Agrico vroeg ons te helpen hun ERP-data inzichtelijk te maken en duidelijke rapportages te ontwikkelen.
Kubernetes-based event-driven autoscaling met KEDA: een praktische gids
In dit Engelstalige artikel beginnen we met een uitleg van wat Kubernetes Event Driven Autoscaling (KEDA) inhoudt. Vervolgens richten we een lokale ontwikkelomgeving in die het mogelijk maakt om KEDA te demonstreren met behulp van Docker en Minikube. Daarna leggen we het scenario uit dat geïmplementeerd zal worden om KEDA te demonstreren, en doorlopen we dit scenario stap voor stap. Aan het einde van het artikel heeft de lezer een duidelijk beeld van wat KEDA is en hoe hij of zij zelf een architectuur met KEDA kan implementeren.
AWS (Amazon Web Services) versus GCP (Google Cloud Platform) voor Apache Airflow
In dit Engelstalige artikel maken we een vergelijking tussen Cloud Composer en MWAA. Dit zal je helpen de overeenkomsten, verschillen en factoren te begrijpen die je moet overwegen bij de keuze voor een cloudoplossing. Weet dat er andere goede opties zijn als het gaat om het hosten van een beheerde airflow-implementatie, zoals Microsoft Azure. De twee die in dit artikel worden vergeleken, zijn gekozen vanwege mijn praktijkervaring met beide beheerde diensten en hun respectievelijke ecosystemen.
Inzicht in de complete salesfunnel dankzij een datawarehouse met dbt
Onze consultants boeken de opdrachten die ze oppakken voor onze klanten in ons ERP AFAS. Als CRM gebruiken we HubSpot. Hierin zien we alle informatie die voorafgaand aan het tekenen van een samenwerkingsovereenkomst relevant is. Wanneer we een deal sluiten, gaat alle informatie uit HubSpot automatisch naar AFAS. HubSpot wordt dus vooral gebruikt voor het proces voordat we een samenwerking aangaan, AFAS juist voor de fase daarna. We wilden de inzet van onze mensen strakker plannen en onze financiële forecasts verbeteren. Daarom besloten we de data uit beide bronnen te koppelen en een datawarehouse op te zetten.
Datakwaliteit: de basis voor effectief datagedreven werken
Dataprojecten moeten vaak snel resultaat opleveren. Het vakgebied is relatief nieuw en om draagvlak te creëren, moet eerst bewezen worden dat het waarde oplevert. Hierdoor bouwen veel organisaties data-oplossingen zonder dat er goed nagedacht wordt over de robuustheid ervan. Met datakwaliteit wordt hierbij vaak onvoldoende rekening gehouden. Wat zijn de risico’s als je datakwaliteit niet op orde is en hoe kun je het verbeteren? Je leest het antwoord op de belangrijkste vragen over datakwaliteit in dit artikel.
Het all-round profiel van de moderne data engineer
Sinds de opkomst van big data zijn veel elementen van de moderne datastack de verantwoordelijkheid geworden van data engineers. Wat zijn deze elementen en hoe moet je je datateam samenstellen?
Inzicht in marktdynamieken voor een stevigere concurrentiepositie
FrieslandCampina Global faciliteert lokale teams in Europa, Azië en Afrika. Ze willen de markt beter in kaart brengen en de teams van nieuwe inzichten voorzien. Doelen hierbij zijn het verstevigen van de concurrentiepositie en het spotten van nieuwe kansen voor uitbreiding.
Azure App functions configureren
In dit Engelstalige artikel beginnen we met het bespreken van Serverless Functions. Vervolgens demonstreren we hoe je Terraform-bestanden gebruikt om het implementatieproces van een doelinfrastructuur te vereenvoudigen, hoe een Function App in Azure kan worden gemaakt, het gebruik van GitHub-workflows om continuous integration en implementatie te beheren, en hoe branching strategieën kunnen worden gebruikt om code wijzigingen selectief uit te rollen naar specifieke instanties van Function Apps.
De kracht van Analytics Engineering
De wereld van data is voortdurend in beweging, en dat geldt ook voor de bijbehorende functies en verantwoordelijkheden binnen datateams. Hieruit is een opkomende rol ontstaan: de Analytics Engineer.
Een gestandaardiseerde manier van dataverwerking met behulp van dbt
Een van de grootste webwinkels van Nederland wilde een gestandaardiseerde manier van dataverwerking ontwikkelen binnen een van de datateams. Alle data werd opgeslagen in het schaalbare cloud datawarehouse Google BigQuery. Binnen dit platform waren grote hoeveelheden data beschikbaar op het gebied van orders, producten, marketing, retouren, klantcases en partners.
Betrouwbare rapportages met behulp van robuuste Python code
Het Nationaal Portaal Wegverkeersgegevens (NDW) is een waardevolle bron voor gemeenten, provincies en de rijksoverheid om inzicht te krijgen in verkeersstromen en de efficiëntie van de infrastructuur te verbeteren.
Opzet van een toekomstbestendige data-infrastructuur
Valk Exclusief is een keten van 4 sterren+ hotels en heeft 43 hotels in Nederland. De hotelketen wil gasten graag een persoonlijke ervaring bieden, zowel in het hotel als online.
Een schaalbaar dataplatform in Azure
TM Forum, een alliantie van meer dan 850 wereldwijde bedrijven, schakelde onze hulp in als datapartner om data gerelateerde uitdagingen te identificeren en op te lossen.
Een volledig geautomatiseerde data import pipeline
Stichting Donateursbelangen wil het vertrouwen tussen donateurs en goede doelen versterken. Daarom wilden ze via een eigen zoekmachine informatie over goede doelen delen met donateurs. De stichting vroeg ons de ANBI-status van goede doelen beschikbaar te stellen voor gebruik in hun zoekmachine. Een instelling krijgt deze status alleen als zij zich (bijna) volledig inzet voor het algemeen belang en zich aan bepaalde voorwaarden houdt.
Een dag in het leven van een Data Engineer
Voor het ontwikkelen van moderne datatoepassingen is de Data Engineer onmisbaar. Maar wat betekent het eigenlijk om Data Engineer te zijn en wat doe je dan precies? Onze collega Oskar, Data Engineer bij Digital Power, legt het je uit.
5 vragen aan Data Engineer Dennis
In deze video ontdek je hoe een baan als Data Engineer eruit ziet! Hoe ziet een werkweek eruit, voor welke klanten werken onze Data Engineers en wat maakt het werken zo leuk? Dennis vertelt je er graag meer over!
Wat is Data Science?
Overal op events en online worden verhalen verteld over wat ‘Data Science’ nu is. Wat daar verteld wordt, gaat alle kanten op. Definities gaan van ‘iets dat van waarde is uit data halen’ tot ‘het is eigenlijk hetzelfde als statistiek’. En een Data Scientist is ‘een data analist die in Silicon Valley woont’ of ‘een sociaal vaardige IT’er die iets met data doet‘. Maar wat is het nu echt?
5 vragen voor Data Analist Dennis
In deze video ontdek je hoe een baan als Data Analist eruit ziet! Hoe ziet een werkweek eruit, voor welke klanten werken onze Data Analisten en wat maakt het werken zo leuk? Dennis vertelt je er graag meer over!
5 vragen voor Data Engineer Oskar
In deze video ontdek je hoe een baan als Data Engineer eruit ziet! Hoe ziet een werkweek eruit, voor welke klanten werken onze Data Engineers en wat maakt het werken zo leuk? Oskar vertelt je er graag meer over!
5 redenen om Infrastructure as Code (IaC) te gebruiken
Infrastructure as Code heeft zich bewezen als betrouwbare techniek om platformen sterk neer te zetten in de cloud. Het vraagt echter wel een extra tijdsinvestering van de betrokken ontwikkelaars. In welke gevallen loont de extra inspanning zich? Je leest het in dit artikel.
Hoe word ik een Data Engineer?
Een paar jaar geleden bestond de functietitel nog niet eens: Data Engineer. Inmiddels is er veel vraag naar Data Engineers. Vrijwel elke organisatie verzamelt bewust data en het besef dat dit op een gestructureerde manier moet gebeuren, groeit. Als de data die je verzamelt niet goed georganiseerd is en klopt, kun je het niet gebruiken als input voor goede beslissingen. Data Engineers bouwen infrastructuren waarmee data wordt verwerkt. Ze zijn daarmee onmisbaar voor organisaties die hun data op een gestructureerde manier willen verzamelen en toepassen.
Centrale dataopslag met een nieuwe data-infrastructuur
Dedimo is een samenwerking van vijf zorginitiatieven in de geestelijke gezondheidszorg. Om de kwaliteit van hun zorg continu te verbeteren, richten ze interne processen efficiënter in. Hiervoor gebruiken ze inzichten uit de data die intern beschikbaar is. Voorheen haalden ze deze data zelf uit verschillende bronsystemen met ad hoc scriptjes. Om dit proces robuuster en efficiënter te maken en verder te professionaliseren, schakelden ze onze hulp in. Ze vroegen ons de centrale opslag van hun data in een cloud data warehouse te faciliteren. Omdat ze al gewend waren te werken met Google Cloud Platform (GCP), was de wens de data-infrastructuur binnen deze omgeving op te zetten.
Verbeterde datakwaliteit dankzij een nieuwe data pipeline
Royal HaskoningDHV ziet het aantal aanvragen van klanten met Data Engineering vraagstukken toenemen. De nieuwe afdeling die ze hiervoor op hebben gericht, is nog groeiende. Ze vroegen ons daarom hun Data Engineering team tijdelijk extra capaciteit te bieden. Één van de vraagstukken waar wij hulp bij boden, was die van Waterschap Aa en Maas.
Afl. 1: Bijna afgestudeerd en klaar voor je eerste job als dataprofessional?
Hoe kom je erachter wat je wil en waar let je op bij vacatures? Ga je voor een groot bedrijf, een klein bedrijf, consultancy of toch iets anders? Dit zijn een aantal van de vragen waar onze afstudeerstagiair Stijn mee zat. Hij ging in gesprek met zijn collega's om antwoord te krijgen op deze vragen. Het resultaat? De Data-keuzecast! In deze podcast stelt Stijn al zijn brandende vragen en ontvangt hij tips die hem (en hopelijk ook jou) helpen een juiste keuze te maken voor een baan in de datawereld.
Digital Power Datahub en Partos lanceren de Data Awareness serie
Op 10 februari 2022 trapten de Digital Power Datahub en het Partos Digital Lab samen de Data Awareness (datawijsheid) serie af met de Intro to Data Awareness. Deze reeks van 6 trainingen ontwikkelt de Datahub speciaal voor de leden van Partos; non-profits in de ontwikkelingssamenwerkingsbranche. Het doel van de serie is om specialisten in de ontwikkelingssamenwerking datawijs te maken, zodat ze meer impact kunnen maken én meten.
Het meetbaar maken van impact
De stichting Designathon Works organiseert Design Hackathons (Designathons) voor kinderen tussen de 8 en 12 jaar. Het doel? Kinderen van over de hele wereld skills aanleren om een ‘changemaker’ te kunnen worden. Ze worden uitgedaagd om oplossingen te ontwerpen voor een betere wereld, bijvoorbeeld het tegengaan van klimaatverandering. Vanuit de Datahub hielpen we Designathon Works kosteloos de impactmetingen aan te scherpen. Ook deden we een eerste aanzet tot automatisering van de dataverzameling, analyse en visualisatie.
Welk data traineeship past bij jou?
Je bent bijna klaar met je studie en zoekt een werkgever die je de ruimte biedt alles te leren over het vakgebied data. Of je wordt niet meer uitgedaagd in je huidige functie en wil graag technischer worden. In beide gevallen, wil je niet onbetaald cursussen volgen, maar wil je graag zo snel mogelijk aan de slag voor echte klanten, mét een serieus salaris. Klinkt dit bekend? Dan zijn deze data traineeships echt iets voor jou.
Een goed georganiseerde data-infrastructuur
FysioHolland is een overkoepelende organisatie voor fysiotherapeuten in Nederland. Een centraal serviceteam ontlast therapeuten van bijkomende werkzaamheden, zodat zij zich vooral kunnen focussen op het leveren van de beste zorg. Naast de organische groei sluit FysioHolland nieuwe praktijken aan bij de organisatie. Deze hebben stuk voor stuk hun eigen systemen, werkprocessen en behandelcodes. Dit heeft de datahuishouding van FysioHolland groot en complex gemaakt.
Een schaalbaar machine learning-platform voor het voorspellen van billboard-impressies
The Neuron biedt een programmatisch biedingsplatform om digitale Out-Of-Home-advertenties in realtime te plannen, kopen en beheren. Ze vroegen ons het aantal verwachte impressies voor digitale advertenties op billboards op een schaalbare en efficiënte manier te voorspellen.
De COVID-19 Violence Tracker
De uitbraak van de coronapandemie begin 2020 heeft de wereld op zijn kop gezet. Naast talloze besmettingen, ziekenhuisopnamen en doden zagen we in veel landen ook een uitbraak van geweld. Burgers gingen, soms met geweld, de straat op om te protesteren tegen getroffen maatregelen, maar ook het huiselijk geweld nam op veel plaatsen toe en angst en frustratie speelden racisme in de hand.
Digital Power valt in de prijzen bij MKB Data Science top 50
Tijdens de ‘MKB Data Science Top 50’ streden 50 bureaus voor de titel ‘het snelstgroeiende mkb-datascience bureau van ons land’. Al voor het event hoorden we dat we in de top 3 stonden! Tijdens de Den Bosch Data Week mocht Marieke onze organisatie pitchen.
Waarom heb ik Data Engineers nodig als ik Data Scientists heb?
Inmiddels is het bij de meeste bedrijven wel duidelijk: datagedreven beslissingen door Data Science voegen concreet waarde toe aan de bedrijfsvoering. Of je doel nu is om betere marketingcampagnes op te zetten, preventief onderhoud aan je machines uit te voeren of fraude effectiever te bestrijden: in elke bedrijfstak zijn er toepassingen van Data Science te vinden.
Een loopbaan als Data Engineer? Geef je eigen opleiding vorm
In juni 2020 werd Sander onderdeel van ons team. Hoewel hij midden in coronatijd startte, merkte hij al snel dat hij flink gestimuleerd werd om contact te maken met zijn nieuwe collega’s. Dit ging grotendeels vanzelf als onderdeel van ons onboarding programma: “Dit sloot perfect aan bij mijn behoeftes: ik ben namelijk zelf veel collega’s gaan opbellen om kennis te maken!” Lees hoe Sander zijn eigen opleiding tot Data Engineer vormgeeft.
De basis voor Data Engineering: robuuste data pipelines
In de basis werken Data Engineers aan data pipelines. Dit zijn data processen die van een bepaalde plek data kunnen halen en het ook weer ergens wegschrijven. In dit artikel lees je meer over de werking van data pipelines en ontdek je waarom ze zo belangrijk zijn voor een robuuste data infrastructuur.
Social listening in de vastgoedmarkt
Vesteda was benieuwd of social listening – het monitoren en analyseren van sociale media-discussies over een merk, concurrenten, producten of hashtags/zoekwoorden – waarde kon toevoegen aan de organisatie. Hiervoor startten we een project dat bestond uit twee onderdelen: het verkennen van mogelijkheden voor social listening op de afdeling Corporate Communicatie en het toepassen van social listening in een lopend Data Science-project.
Wat is een data architectuur?
Data gedreven werken helpt je betere beslissingen te maken. Hoe beter je datakwaliteit, hoe meer je erop kunt vertrouwen. Een goede data architectuur is een basisingrediënt voor datagedreven werken. In dit artikel leggen we uit wat een data architectuur is en wat een Data Architect doet.
Social Network Analysis in verkiezingstijd
Dinsdag 3 maart 2020 stond te boek als Super Tuesday, de dag waarop in verschillende Amerikaanse staten tegelijkertijd wordt gestemd voor de Democratische presidentskandidaat. We gebruiken deze dag als case voor de toepassing van Social Network Analysis. Dit voorbeeld gaat over verkiezingen, maar je kunt dezelfde werkwijze ook toepassen op een commerciële case waarbij je de namen van de kandidaten vervangt door bijvoorbeeld verschillende merknamen.
Hoe je Social Network Analysis inzet voor inzicht in de publieke opinie
De Corona-maatregelen zijn een veel besproken onderwerp op Twitter. Het crisisteam strijdt niet alleen tegen de effecten van Corona op de volksgezondheid, maar probeert ook de legitimiteit voor de keuze voor bepaalde maatregelen onder het publiek te behouden. Met deze praktijkcase leggen we uit hoe je de publieke opinie op Twitter inzichtelijk maakt met Social Network Analysis.
Social Network Analysis: hoe je inzicht krijgt in netwerken op social media
Wanneer je organisatie actief is op social media en je de online strategie wilt optimaliseren, moet je weten wat er online om je heen gebeurt en wat de impact is van jouw activiteiten. Social Network Analysis kan je daarbij helpen. We leggen je uit wat het is, hoe het werkt en voor welke doeleinden je het kunt toepassen.
Hoe tekstanalyse RNW Media helpt te luisteren en actie te ondernemen
RNW Media bouwt online communities in landen met beperkte vrijheden. In deze communities kunnen jongeren lezen en discussiëren over seksuele en reproductieve gezondheid en rechten (SRGR) en over burgerrechten. Hiernaast werkt RNW Media aan advocacy – het op de kaart zetten van de belangen van jongeren bij overheden.
Meetbare impact op social change met behulp van een datalake
RNW Media is een NGO die zich richt op landen waar beperkte vrijheid van meningsuiting is. De organisatie probeert impact te maken via online kanalen als social media en websites. Om die impact te meten, stelde RNW Media een Theory of Change (een soort KPI framework voor NGO’s) op.
Hoe vind je een geschikte data scientist?
Steeds meer organisaties gaan aan de slag met Data Science. Logischerwijs neemt het aantal vacatures flink toe. Maar hoe stel je een bruikbare functieomschrijving op voor een Data Scientist - en vooral: hoe kies je de juiste? In dit artikel lees je wat je moet doen, en wat níet.
Van ethische data naar doen
De invoering van de nieuwe privacywet (AVG) in 2018 zorgde ervoor dat veel organisaties privacy hoog op de agenda zetten. In dit artikel lees je over de 5 ethische risico's rondom digitaal werken en werken met data. Ook delen we een concrete oplossing met je: het Responsible Data Framework.
Bepaling van de ligging van tuinen met behulp van Data Science
Woningbelegger Vesteda werkt aan een nieuwe website. Als een beschikbare huurwoning een tuin heeft, moet op de webpagina van die woning de ligging van de tuin staan. Deze informatie was nog niet beschikbaar in de database. Wij kregen de opdracht om de ligging van de tuin te bepalen op basis van de coördinaten van de woningen.
Hoe werkt Data Science in de praktijk?
Organisaties die aan de slag willen met data, vragen al snel om Data Science oplossingen. Data Science wordt namelijk vaak gezien als de heilige graal van datagedreven werken. Maar hoe ziet een succesvol Data Science project er in de praktijk nou eigenlijk uit? En wat kan het voor je organisatie betekenen? In deze reeks artikelen nemen we je mee langs alle elementen die je nodig hebt om succes te behalen voor je organisatie met Data Science.
Toepassing van Natural Language Processing (NLP) en text mining voor procesverbetering
Fair Wear is een non-profit organisatie die de arbeidsomstandigheden van werknemers in kledingfabrieken wil verbeteren. De NGO heeft de afgelopen jaren veel documentatie verzameld over haar werkzaamheden, bijvoorbeeld in de vorm van verslagen van een klachtenlijn voor fabrieksmedewerkers, rapporten van audits waarbij gecheckt wordt of fabrieken aan de richtlijnen voldoen, en rapporten van trainingen aan fabrieksmedewerkers. Deze informatie wordt opgeslagen als getypte tekst, met name in Word- of PDF-formaat.
Betrouwbaar inzicht in de drukte in treinen en op stations met een algoritme.
Steeds meer mensen reizen met het openbaar vervoer. Verschillende stations in Nederland worden verbouwd of vernieuwd om aan het groeiende aantal treinreizigers te blijven voldoen. Voor de verbouwings- en inrichtingsplannen was informatie nodig over de drukte op de stations. Ook wilde NS Stations hiermee in samenwerking met ProRail de transferveiligheid verbeteren.
Digitale transformatie en betere interne samenwerking dankzij inzicht in off- én online data
Uitgever Malmberg verzamelt veel off- en online data. Steeds meer onderwijsinstellingen maken gebruik van online licenties ter aanvulling op (of in plaats van) gedrukt lesmateriaal. Om hierop in te spelen, maakt Malmberg gebruik van maandelijkse rapportages. Het in-house data team stelt deze samen als input voor specifieke afdelingen. Malmberg vroeg ons dit team te versterken en de interne processen rondom data efficiënter te maken.