Een volledig geautomatiseerde data import pipeline
Stichting Donateursbelangen
- Klantcase
- Data Engineering
- Dataprojecten
Stichting Donateursbelangen wil het vertrouwen tussen donateurs en goede doelen versterken. Daarom wilden ze via een eigen zoekmachine informatie over goede doelen delen met donateurs. De stichting vroeg ons de ANBI-status van goede doelen beschikbaar te stellen voor gebruik in hun zoekmachine. Een instelling krijgt deze status alleen als zij zich (bijna) volledig inzet voor het algemeen belang en zich aan bepaalde voorwaarden houdt.
Er was al gewerkt aan een eigen oplossing om wekelijks gegevens uit een openbare dataset van de website van de Belastingdienst te halen. Dit deden ze door de gegevens met behulp van Google Apps Script om te zetten naar een Google Sheet.
Ze vroegen ons met drie dingen aan de slag te gaan:
- Het oplossen van enkele technische problemen in de huidige implementatie.
- Het automatiseren van een wekelijkse update van de ANBI-tabel en documenteren wanneer er updates aan deze gegevens plaatsvonden.
- Extra databronnen en data toevoegen aan het ANBI-overzicht.
Onze aanpak
In eerste instantie gingen we aan de slag met het oorspronkelijke verzoek. We losten technische problemen in de huidige implementatie op. De keuze voor Google Apps Script voor de implementatie riep ondertussen vragen bij ons op. Google App Scripts heeft beperkte mogelijkheden om data te importeren en transformeren. Hierdoor was het geen handige tool om de ANBI-tabel verder uit te breiden met informatie uit extra bronnen.
In overleg met Stichting Donateursbelangen kozen we ervoor een nieuwe implementatie te bouwen met een op Python gebaseerde tool. Dit was efficiënter dan verder bouwen op de bestaande implementatie. Python is namelijk een geschiktere taal om data te verwerken.
De nieuwe tool was, net als Google App Script, gratis en eenvoudig te onderhouden. We bouwden de implementatie in Google Cloud Platform met behulp van serverloze Python Cloud Functions in combinatie met Cloud Scheduler voor de automatische wekelijkse data import.
Het resultaat
Stichting Donateursbelangen heeft nu een volledig geautomatiseerde import pipeline met inzicht in de laatste ANBI status voor goede doelen. Geïnteresseerde donateurs kunnen deze informatie op hun website bekijken. De zoekfunctionaliteit op de website van de Belastingdienst is beperkt tot de zoektermen goede doelennaam of woonplaats. De zoekfunctionaliteit op de Stichting Donateursbelangen maakt het voor donateurs mogelijk om ANBI goede doelen te vinden op basis van naam, woonplaats, fiscaal nummer en URL.
De toekomst
Stichting Donateursbelangen wil hun database en zoekmachine in de toekomst uit te breiden met aanvullende informatie over goede doelen. Door het gebruik van een Python-script via Google Cloud Functions en Cloud Scheduler kan dit makkelijk en snel geregeld worden.
Dit project voerden we uit via onze stichting, de Digital Power Datahub.
1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?
Meld je aan voor onze maillijst en blijf 'up to data':