Kwalitatieve onderzoekers vervangen door AI, een goede beslissing?

Praktische voorbeelden van AI versus de menselijke onderzoeker

Artikel
Research

Marit Loonen

(UX) Researcher

5 min

26 Feb 2024

Artificial Intelligence lijkt alles te kunnen, en soms zelfs beter en sneller dan dat we het zelf kunnen doen. Het analyseren van kwalitatieve data is een tijdrovende klus, waarvan we als onderzoekers nieuwsgierig zijn of het sneller en gemakkelijker kan. Biedt AI hiervoor een oplossing? Onze onderzoekers zochten het uit.

Aanpak

Artificial Intelligence is overal in het nieuws en wordt steeds breder ingezet, onder andere voor de analyse van kwalitatieve data. Je wilt natuurlijk niet dat gebruik van AI tot een verlaging van je kwaliteitsstandaard leidt. Wij zochten voor je uit wat de kwaliteit is van kwalitatieve analyses gedaan met AI-tools.

Voor dit onderzoek gebruikten we verschillende AI-tools (ChatGPT 4.0, Survalyzer, Atlas.ti) en een eigen unsupervised clustering model (Python) om open antwoorden van vragenlijsten te analyseren. Deze antwoorden hadden we eerder al handmatig geanalyseerd. In dit artikel de resultaten van onze test: AI versus Digital Power-onderzoeker.

AI vs. Onderzoeker: bevindingen

Black box & verzonnen resultaten

Veel AI-tools zijn 'black boxes': het is erg moeilijk om inzicht te krijgen in hoe ze tot hun resultaten komen. Voor wetenschappelijk onderzoek is het van cruciaal belang dat analyses kunnen worden gerepliceerd, wat door de black box niet mogelijk is. Daarnaast is het door deze ‘black box’ vaak amper mogelijk om de analyse van de AI-tool te checken: welke data is op welke manier gecategoriseerd?

Een voorbeeld hiervan kwamen we tegen tijdens onze poging tot een analyse van kwalitatieve data met ChatGPT 4.0. Als we vroegen om een lijst met de voornaamste bevindingen uit de data, kregen we ook ‘bevindingen’ die helemaal niet voorkwamen in de data, maar die wel realistisch leken. Dit zagen we alleen omdat we zelf al goed op de hoogte waren van de inhoud van de data door onze ‘menselijke’ analyse. Hierin zit een van de belangrijkste valkuilen van ChatGPT: het verkondigt op zelfverzekerde toon informatie die mogelijk niet klopt.

Categorisatie in eigen categorieën

In Survalyzer (een tool die gebruikt maakt van ChatGPT) voegden we onze eigen categorieën toe. We gebruikten de tool om de open antwoorden te categoriseren. Maar een fractie (rond de 10 procent) van de antwoorden werd aan een categorie toegewezen. Ook zagen we in deze categorisatie veel inconsistentie: zo werd het antwoord ‘hoge reiskosten’ bijvoorbeeld niet toegevoegd aan de categorie ‘reizen’, maar het antwoord ‘reiskosten’ wel.

Een ander struikelblok was dat AI-gegenereerde resultaten vaak in de categorie 'overig' werden geplaatst. Hierdoor gingen waardevolle inzichten verloren. Onze handmatige categorisatie bleek in veel gevallen effectiever, met een grotere proportie data die gecategoriseerd werd in een bijpassend thema.

Categorisatie in door AI-gegenereerde categorieën

AI-tools kunnen ook gebruikt worden om (eerst) categorieën te laten genereren, waarin de data vervolgens gecategoriseerd wordt. De tools creëerden soms ontzettend veel categorieën, die te gedetailleerd waren. Zo werden in AtlasTi meer dan honderd categorieën gecreëerd voor de analyse van één open vraag. Dit maakt het lastig om zinvolle, overkoepelende inzichten te verkrijgen met categorieën die representatief zijn voor een groter deel van de data.

Voor het unsupervised clustering model geldt dat zelf code schrijven voor deze analyse veel tijd kost, net als een handmatige analyse. Het model moet daarnaast voldoende informatie (dus antwoorden in open vragen) hebben om iets nuttigs te kunnen zeggen.

AI: nuttig voor kwalitatieve analyse, of niet?

Het gebruik van AI-tools voor het analyseren van open surveyvragen is op dit moment van weinig toegevoegde waarde. Op dit moment is AI nog niet zo ver dat je je data zomaar in een tool kunt gooien en dat hier vervolgens betrouwbare resultaten uitkomen. Uiteraard wordt er hard gewerkt aan het verbeteren van deze tools, maar tot die tijd zal er nog veel handmatig werk plaats moeten vinden. Dat betekent zeker niet dat we geen mogelijkheden zien voor het gebruik van AI voor kwalitatieve analyses.

Wanneer zou AI nuttig kunnen zijn?

Als er al bestaande, eenduidige categorieën zijn die nauw aansluiten bij de data: een demo van Survalyzer laat hierin veelbelovende resultaten zien, ook al was dit bij onze data niet het geval. Je zult de categorieën wel eerst handmatig op basis van een substantiële subset van de data moeten maken. Dit zal een iteratief proces zijn, waarbij je moet controleren in hoeverre de categorieën bruikbaar zijn voor de AI-tool.
Bij zeer grote datasets: hoe groter de dataset, hoe meer data gebruikt kan worden om op te trainen. Ook zal de voorbereiding, zoals hierboven beschreven, het vooral waard zijn bij grotere datasets.
Als aanvullende controle op handmatige analyses, waarbij je je eigen resultaten toetst op bias: in de wetenschappelijke wereld wordt vaak gebruik gemaakt van controles door peers, zoals peer reviews van artikelen, het reproduceren van onderzoek of het berekenen van de inter-rater reliability (de mate van overeenstemming tussen meerdere onafhankelijke beoordelaars die dezelfde analyse uitvoeren). In de praktijk kost het vaak te veel tijd om deze controles door collega-onderzoekers uit te laten voeren. Een extra check, bijvoorbeeld door een AI-tool, kan dan uitkomst bieden. Bij gebrek aan beschikbaarheid van mede-onderzoekers kan zo gecheckt worden op gemiste inzichten en bias.

Conclusie: de menselijke onderzoeker wint (voorlopig) van AI

Op het moment zijn we tegen te veel problemen en beperkingen aangelopen om voor kwalitatieve analyse te vertrouwen op AI-tools. Ook in de nabije toekomst raden we aan om bij onderzoek waar diepgaande kennis van de data vereist is, voorkeur te geven aan menselijke onderzoekers boven AI-functionaliteiten.

Bij Digital Power blijven we echter de ontwikkelingen in de AI-wereld volgen en staan we open voor nieuwe mogelijkheden. We zijn ervan overtuigd dat AI een waardevolle rol kan spelen in de toekomst van onderzoek, maar vinden het essentieel dat mensen de grenzen en beperkingen van AI begrijpen en kritisch evalueren.

Ten slotte: wat vindt ChatGPT er eigenlijk zelf van?

“ChatGPT en vergelijkbare AI-modellen kunnen nuttig zijn bij de analyse van kwalitatieve data uit open survey vragen, maar er zijn beperkingen. Ze moeten worden getraind en gevalideerd, en kunnen bevooroordeeld zijn. Menselijke expertise blijft belangrijk voor diepgaande inzichten en het corrigeren van fouten. AI kan vooral handig zijn bij grote datasets om patronen te ontdekken, maar moet worden aangevuld met menselijke analyse voor nauwkeurigheid en context.”

Hier kunnen we ons wel in vinden.

*De hulp van ChatGPT is ingeroepen om dit artikel te schrijven, maar voldeed helaas niet aan onze verwachtingen.

Dit is een artikel van Marit

Marit is onderzoeker bij Digital Power en wordt enthousiast van het inzetten van kwalitatieve en kwantitatieve onderzoeksmethodes voor het begrijpen van menselijk gedrag, gedachtes en behoeftes. Met haar achtergrond in Human-Technology Interaction combineert ze haar kennis van psychologie, onderzoek en data analyse om tot inzichten en oplossingen te komen die bijdragen aan een betere gebruikerservaring. Team Lead Research Mieke Kleppe is co-auteur van dit artikel.

Marit Loonen

(UX) Researcher

1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?

Meld je aan voor onze maillijst en blijf 'up to data':

aanmelden

Misschien vind je dit ook interessant

website-optimalisatie op basis van ux research

Stop met het doen van onnodige investeringen in website-optimalisatie

Je hebt sterk het gevoel dat je website of een bepaalde pagina niet meer voldoet aan je klantbehoeften of huisstijl: tijd voor een update! Ga je gelijk investeren in de ontwikkeling van iets nieuws óf ga je eerst investeren in onderzoek? In deze blog leggen we uit waarom onderzoek voorafgaand aan website-optimalisatie je veel onnodige kosten en problemen kan besparen.

Lees meer

Optimale gebruikerservaring voor Memoriam Platform

KWF Kankerbestrijding is een Nederlandse stichting die zich inzet voor kankerbestrijding. De organisatie was bezig met de opzet van het Memoriam Platform. Dit is een nieuw initiatief dat het mogelijk maakt om gepersonaliseerde herdenkpagina’s voor overledenen te maken. Op deze pagina kan gedoneerd worden aan het KWF.

Lees meer

Betere dienstverlening o.b.v. een onderzoekscyclus

Ook Nederlanders die in het buitenland wonen, werken of studeren, moeten zaken als de verlenging van een paspoort, belastingzaken en pensioen regelen bij de Nederlandse overheid. Dit wordt bemoeilijkt door de afstand van Nederland, versnippering van de dienstverlening, tijdverschil en afwijkende situaties. Het Ministerie van Buitenlandse Zaken werkte daarom van 2018-2022 in een project samen met 12 uitvoeringsorganisaties, zoals de Belastingdienst en RDW, aan een rijksbrede ingang bij de overheid waar deze mensen terecht kunnen: Nederland Wereldwijd (NWW). NWW is 24/7 toegankelijk via de website en directe klantcontactenkanalen zoals telefoon, whatsapp en email.

Lees meer

Neem betere beslissingen met kennis van je gebruikers' wensen en behoeften

Verzamel waardevolle klantinzichten met datagedreven UX research. Identificeer problemen, los ze op en ontwikkel intuïtieve, effectieve en gebruiksvriendelijke producten.

Lees meer

Digital Power lanceert UX Research solution

Consultancy.nl interviewde onze Team Lead Mieke Kleppe over deze nieuwe data solution UX Research.

Lees meer

ux research voor website-optimalisatie header afbeelding

Onderzoek naar de match tussen branding en gebruikersperceptie op onze nieuwe website

In oktober 2022 ging onze eigen nieuwe website live, in een fris design. We vroegen onze partner Kaliber onze branding en website te vernieuwen met een design dat bij onze merkwaarden past. Na livegang van de site wilden we weten of dit was gelukt. Onze eigen onderzoeksconsultants onderzochten daarom hoe effectief het nieuwe design onze waarden en verhaal overbrengt.

Lees meer

onderzoeksconsultants in gesprek met elkaar

Jouw research partner

Doe diepgaande inzichten op over over de gedachten, gevoelens, behoeften en het gedrag van je doelgroepen. Vergroot je impact met effectieve oplossingen, processen en diensten die aansluiten op hun specifieke wensen.

Lees meer

Volledig inzicht in de klantreis met Google Analytics en R

Via de websites van ONE Business kunnen gebruikers abonnementen op diverse magazines afsluiten. De online salesfunnel is hierbij per aanbieding dynamisch in te delen. Zo is het mogelijk om gebruikers vrije termijnkeus te geven of deze te beperken tot een specifieke aanbieding. Omdat de salesfunnel dynamisch is, is het met de standaard Google Analytics implementatie onmogelijk om goed inzicht te krijgen in de klantreis. ONE Business vroeg ons inzichtelijk te maken waar mensen uitvallen en waarom. Op basis hiervan kunnen ze de funnel optimaliseren voor meer online conversie.

Lees meer

Doelgroepenonderzoek voor nieuwe website

De organisatie Dokters van de Wereld biedt medische hulp aan mensen in een kwetsbare positie. Ze weten vaak hun weg niet te vinden in het Nederlandse zorgsysteem. Dokters van de Wereld helpt hen hierbij. Eén van de kanalen om te informeren over het werk van Dokters van de Wereld is de website. Deze wordt in een nieuw jasje gestoken.

Lees meer

Geef je datastrategie vorm met onze data experts

Je organisatie groeit en je vraagt je af hoe je data hierin efficiënt en effectief mee kan groeien. En hoe zorg je ervoor dat iedereen mee kan in de stappen die je neemt op weg naar datavolwassenheid? Met een goede datastrategie weet je hoe je dit soort vraagstukken op kunt lossen.

Lees meer