Het belang van datakwaliteit

De verstrekkende gevolgen als documentatie niet op orde is

  • Artikel
  • Data Analytics
Chantal-data-analyst
Chantal van der Jagt
Lead Data Analyst
9 min
10 Jun 2020

Ga je beslissingen maken op basis van data? Dan moet je ervoor zorgen dat je datakwaliteit op orde is. Goede documentatie volgens een helder proces is hierbij essentieel. Waarom en hoe? Je leest het in dit artikel.

Verbeteringen in de zorg met behulp van data

Het UMC Utrecht is sinds enige tijd aan het experimenteren met Data Science in de psychiatrie. In een video is te zien dat ze met Data Science een manier zoeken om de onvoorspelbare psychiatrische patiënt voorspelbaarder te maken.

Het ziekenhuis gebruikt onder andere persoonlijke- en gevoelige data afkomstig uit wearables, sociale data en input van de patiënt en naaste familieleden met onder andere woordgebruik analyses. Zo kan het algoritme verrijkt worden met contextuele data die veel kan vertellen over mogelijke triggers bij psychiatrische patiënten.

De genoemde voordelen zijn legio: een betere én snellere diagnose, betere aansluiting met medicatie en preventieve zorg kunnen verlenen. Maar ook minder administratieve handelingen voor artsen en verplegend personeel, met mogelijk minder benodigd zorgpersoneel als antwoord op het personeelstekort in de zorg. Enorme verbeteringen, op voorwaarde dat bij het gebruik van dit type data aan de privacywetgeving (AVG) wordt voldaan.

Maar wat als er foutjes in de data zitten?

Het experiment van het UMC Utrecht is een sprekend voorbeeld. En dit is niet de enige zorginstelling die als doel heeft met de best mogelijke zorg de waardigheid van een individu zo lang mogelijk intact te houden.

Maar wat als er kleine fouten in de data sluipen? Historische data is mogelijk subjectief. Data input is mogelijk onvolledig en mist relevante data vanuit andere zorginstellingen en overheidsinstanties (overdracht). Data definities zijn mogelijk verschillend per bron. Data wordt mogelijk verkeerd geïnterpreteerd.

Fouten in de data kunnen, hoe klein ook, potentieel desastreuze gevolgen hebben voor het welzijn van patiënten. Bij een verkeerde diagnose kan het ziektebeeld verder verergeren of kunnen zich andere stoornissen ontwikkelen. Daardoor loopt de kwaliteit van leven voor deze patiënten zover terug dat het doel; goede zorg, een averechts effect sorteert.

Het algoritme vergroot niet de menselijke waardigheid, het reduceert het. De potentie alleen is om bij de huiveren. Dit is een scenario dat de EU met de AVG juist zo hard probeert te voorkomen. Daarom wordt gesteld dat transparantie noodzakelijk is voor organisaties die zich bezighouden met dataverzameling en -toepassing.

Focus op datakwaliteit

Als je als organisatie weet dat slechte, of zelfs maar iets minder goede, datakwaliteit verstrekkende negatieve gevolgen kan hebben voor je uiteindelijke afnemer (in dit geval de individuele patiënt), zul je er alles aan willen doen om dit te voorkomen en protocollen in te bouwen die de kwaliteit waarborgen.

Het documenteren van data: een cruciale taak die vaak niet (volledig) wordt uitgevoerd

Om je datakwaliteit te borgen, moet je heldere processen en duidelijke protocollen hebben binnen je organisatie. In de praktijk is het reproduceerbaar documenteren van data vaak de laatste en minst dankbare stap in een proces.

Doordat op tempo gewerkt wordt, is dit zelfs de stap die vaak onvolledig wordt uitgevoerd of geheel wordt overgeslagen. Maar wat betekent dat eigenlijk?

Ter illustratie zie je hieronder drie verschillende typen resultaten:

datakwaliteit

Als je goed bouwt, heb je een huis. En op basis van betrouwbare patiëntdata kan een arts de juiste diagnose stellen. Met behulp van klantdata kun je een gepersonaliseerd aanbod bieden.

Maar wat als er in de proces stappen een foutje sluipt? Het resultaat ziet er dan een stuk minder rooskleurig uit. Is het eindresultaat dan nog wel betrouwbaar genoeg? Hieronder zie je wat er kan veranderen als de data niet helemaal klopt:

datakwaliteit

Van de eerste twee voorbeelden kunnen we ons allemaal een levendige voorstelling maken van de te nemen stappen en het resultaat. In het UMC voorbeeld zou de impact groot en negatief zijn als de proces stappen niet secuur en doordacht doorlopen zijn. Het zou nog ziekere patiënten opleveren door toedoen van onjuiste input of verwerking.

In het bouw voorbeeld zou een misrekening van een overspanning tussen twee dragende muren een dramatische afloop kunnen hebben. Als het huis niet exact volgens ontwerp en constructie gebouwd wordt, is het geen huis, maar een aaneenschakeling van ramen, stopcontacten en muren zonder enig plan. Is het dan nog wel een huis?

Het laatste resultaat is net zo pijnlijk, maar minder goed zichtbaar. Het is veelal een geaccepteerde foutmarge en daarbij lijken de resultaten redelijk overeen te komen met wat men voor ogen had. Maar als het ontwerp en de instructie een fout bevatten, heeft dat effect op het resultaat.

Stel jezelf de volgende vragen:

  • “Is het minder erg als er budget wordt besteed aan initiatieven en ontwikkelingen die er onderaan de streep niet toe doen?”
  • “Is het minder erg als het niet reproduceerbaar is waarom, hoe en wanneer data tot stand is gekomen?”
  • “Is het minder erg als experimenten, qua data input, zo onbetrouwbaar zijn dat een gok in de wilde weg waarschijnlijk een even groot effect zou sorteren?”

De kans is groot dat zal iedere zichzelf respecterende organisatie hier absoluut niet op zit te wachten.

Er is teveel focus op zichtbare resultaten

Toch sluipt het er met Lean, Agile en scrum werkmethodes snel in. Waarin waardering vooral tot uiting komt bij het opleveren van zichtbare resultaten. Dat is waar de dankbaarheid vanuit stakeholders in huist. Zij willen resultaten zien, we doen het immer voor hen. Als zij blij zijn, wat is dan het probleem?!

Naast het feit dat dit niet slim is en het je potentieel veel geld kost, is het onethisch. Je levert namelijk ondeugdelijk resultaat. Niet alleen voor jezelf en je collega’s (denk aan het extra werk dat het kost om alles te cross checken en work-arounds te bedenken). Maar ook voor je organisatie: deze investeert immers in deze vruchteloze tijdsbesteding.

Ook de eindgebruiker, je klant wordt benadeeld. Deze wordt namelijk opgezadeld met een resultaat waarbij hij níet centraal staat. Zo wordt hij bijvoorbeeld in een segment ingedeeld waar hij niet thuishoort en matcht de service die hij krijgt niet (optimaal) met zijn klantgedrag.

Documenteren: hoe het dan wél moet

Het volgen van een aantal heldere documentatie stappen kan op termijn veel frustratie en vruchteloze tijdsbesteding schelen. Het kost nu moeite om er later de vruchten van te kunnen plukken.

Goede documentatie en heldere data processen creëren organisatie breed heldere definities over metrics, gebruikte regels en de context waarin het gebruikt dient te worden. Het zorgt ervoor dat alle afdelingen dezelfde taal spreken en elkaar begrijpen. Hierdoor zijn Key Performance Indicators (KPI’s), targets en operationele actiepunten logisch en goed te onderbouwen voor alle lagen van de organisatie die met de data werken. Het biedt een fundament waar je samen op voort kunt bouwen.

Documenteren: een stappenplan

Ben je overtuigd van de noodzaak van goede documentatie? We helpen je graag op weg met een stappenplan wat je helpt documentatie als procesonderdeel mee te nemen in je workflow.

stappenplan

Business requirements

Dit beschrijft een gewenst resultaat en komt voort uit wat de business stakeholders moeten weten. De benodigde informatie voor business stakeholders dient in lijn te zijn met de organisatie- en afdeling strategie en doelstellingen.

Het is een fase die héél veel afstemming vergt met alle stakeholders, om uiteindelijk tot gezamenlijk gedragen business requirements te komen. Besteed hier het grootste deel van je tijd aan.

Datalaag documentatie

Dit vormt het ontwerp én de instructie van variabelen die vanaf de website datalaag uitgelezen moeten worden om vervolgens gemeten te worden in dimensies en/of metrics van de meetoplossing.

Meetoplossing documentatie

Dit vormt het ontwerp én de instructie van de meetoplossing. Het beschrijft met welke dimensies, variabelen, metrics, business rules én definities de benodigde meting voor de business requirements opgezet moet worden.

Beschrijving analytics model

Dit beschrijft, in heldere termen, de definitieve meetoplossing. Welke dimensies, variabelen, metrics, business rules en definities zijn toegepast om de meting tot stand te brengen? Belangrijk is dat hier heldere termen worden gebruikt. Het vormt hét naslagwerk dat door de organisatie geraadpleegd moet worden.

Analyse voorbeelden

Dit geeft ondubbelzinnig weer welke type rapportages en analyses gedaan kunnen worden met dit analytics model.

Loop je achter qua documentatie?

Het kan zijn dat je met achterstallig documentatie onderhoud te maken hebt. In dat geval kun je net als bij bug fixes, een toegewijd aantal uren per sprint toekennen aan het documenteren met terugwerkende kracht:

Start met rondes langs de velden met de checkvraag of de business requirements en huidige metingen nog wel op elkaar aansluiten;

Met deze uitkomsten ga je als volgt te werk:

  • Start met het goede nieuws en documenteer alle metingen die nog steeds voldoen aan de business requirements, maar nog niet/onvolledig gedocumenteerd zijn;
  • Vervolg met metingen waar een mismatch zit tussen business requirements en huidige meetoplossing en zet deze als Request For Change (RFC) op de backlog;
  • Eindig met metingen die niet meer voorkomen in de business requirements. Deze zullen uitgefaseerd moeten worden.

Aan de slag!

Ga je na het lezen van dit artikel (beter) documenteren? Prioriteer dan steeds op business impact. Zo werk je stap voor stap aan goede documentatie en breng je de datakwaliteit steeds verder op orde. Wil je hier hulp bij? Neem contact met ons op.

Dit is een artikel van Chantal van der Jagt, Lead Consultant Data Analytics bij Digital Power

Chantal heeft bij Digital Power aardig wat organisaties geholpen. Ze heeft vanuit zowel strategisch als operationeel gezichtspunt ervaring in hoe strategie, data en werkwijze op elkaar afgestemd moeten zijn om tot een geïntegreerde data-gedreven manier van werken te komen.

Chantal van der Jagt

Lead Data Analystchantal.vanderjagt@digital-power.com

1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?

Meld je aan voor onze maillijst en blijf 'up to data':