Toepassing van Natural Language Processing (NLP) en text mining voor procesverbetering

Fair Wear

  • Klantcase
  • Data Science
  • Dataprojecten
fairwear-logo
Joachim-business-manager
Joachim van Biemen
Business Manager
3 min
22 Feb 2019

Fair Wear is een non-profit organisatie die de arbeidsomstandigheden van werknemers in kledingfabrieken wil verbeteren. De NGO heeft de afgelopen jaren veel documentatie verzameld over haar werkzaamheden, bijvoorbeeld in de vorm van verslagen van een klachtenlijn voor fabrieksmedewerkers, rapporten van audits waarbij gecheckt wordt of fabrieken aan de richtlijnen voldoen, en rapporten van trainingen aan fabrieksmedewerkers. Deze informatie wordt opgeslagen als getypte tekst, met name in Word- of PDF-formaat.

De verwachting was dat er zeer relevante, unieke inzichten uit de data gehaald kon worden. Doordat er enkel ongestructureerde data (getypte tekst) beschikbaar was, bleek dit echter onmogelijk te analyseren voor Fair Wear. Ze vroegen onze Data Scientists modellen te maken die alle relevante data uit de audit- en trainingsrapporten halen en klachten automatisch op onderwerp classificeren. Met de nieuwe inzichten kan Fair Wear de eigen procedures verbeteren en best practices delen met andere NGO’s, overheden en belangenorganisaties.

Onze aanpak

We startten met de klachtendata. Middels kwalitatief onderzoek achterhaalden we de relevante en terugkerende topics. Hiervoor interviewden we de stakeholders binnen Fair Wear en analyseerden we de klachtendata kwalitatief. Vervolgens linkten we de uitkomsten van de interviews aan de terugkerende topics in de data en labelden we de klachtendata handmatig. Deze dataset vormde de basis voor het ontwikkelen van een automatisch classificatiemodel.

Na het kwalitatieve onderzoek gingen we aan de slag met Natural Language Processing (NLP). We trainden een NLP model op basis van de hand gelabelde data, met als doel de topics zo goed mogelijk te benaderen. Daarna pasten we text mining toe: hiermee kunnen klachtteksten die bijvoorbeeld termen zoals ‘geslagen’, ‘fysiek’ of ‘pijn’ bevatten middels queries onder het topic ‘fysieke mishandeling’ worden geplaatst.

Door NLP te combineren met text mining, konden we een optimale betrouwbaarheid van het model garanderen. Dit is essentieel bij de interpretatie van dit type gevoelige informatie.

Het resultaat

Het NLP model voor de klachtendata is een ‘supervised multi-label topic model’ wat getraind is op door mensen gevalideerde data. Hierbij kunnen meerdere topics (labels) worden toegekend aan één klacht of audit. Het model is volledig op maat toegespitst op de specifieke wensen van Fair Wear.

De output bestaat uit een gestructureerde dataset waarbij alle klachten en audits uit het verleden zijn geclassificeerd als topics en variabelen. Nieuwe klachten worden met behulp van ons NLP model automatisch en zeer betrouwbaar geclassificeerd. Daarnaast maakten we specifieke modellen om data uit audit- en trainingsrapporten gestructureerd op te slaan.

In totaal definieerden we voor de klachtendata ongeveer 40 relevante topics, waarvan 8 volledig met NLP bepaald kunnen worden. Voor de overige topics is te weinig data beschikbaar om betrouwbaar te modelleren. Om de topics toch te vinden, wordt hier text mining toegepast. Met deze topics hebben Fair Wear medewerkers inzicht in de problematiek die speelt bij fabrieksmedewerkers. De audit- en trainingsrapporten zijn samengevat in datasets die geanalyseerd kunnen worden.

De basis voor een nieuw rapportagesysteem

De resultaten van de NLP en text mining projecten dienen ook als basis voor de inrichting van een nieuw rapportagesysteem. Hierbij kunnen tekstvelden in de toekomst vervangen worden door bijvoorbeeld dropdowns en checkboxen. Zo wordt het rapporteren van klachten, audits en trainingen eenvoudiger, met een lagere werkdruk voor Fair Wear medewerkers tot gevolg. Fair Wear heeft nu inzicht in de topics van binnenkomende klachten, en oplossingen die wel en niet werken. Op basis hiervan kan de NGO haar processen verbeteren. De leerpunten en best practices worden gedeeld met andere NGO’s, overheden en belangenorganisaties.

Meer weten?

Joachim gaat graag met je in gesprek over wat we als datapartner voor jou en je organisatie kunnen betekenen.

1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?

Meld je aan voor onze maillijst en blijf 'up to data':