Snelle en betrouwbare interne informatie met behulp van AI Document Explorer
Een financiële instelling
- Klantcase
- Dataprojecten
- Data Engineering
Financiële instellingen moeten grote hoeveelheden documentatie verwerken. Voor deze specifieke instelling faciliteert een intern team dit door bijvoorbeeld samenvattingen te maken met behulp van tekstanalyse en natural language processing (NLP). Deze maken ze beschikbaar voor de verschillende business units. Om audits efficiënter uit te voeren, wilden ze een vraag- en antwoordmodel ontwikkelen om sneller de juiste informatie tot hun beschikking te hebben. Toen ChatGPT werd gelanceerd, vroegen ze ons een proof of concept te maken.
Het opzetten van een large language model binnen een eigen omgeving met eigen data is een relatief nieuw vakgebied. Om de privacy te waarborgen en een veilige omgeving op te zetten, maakten we gebruik van de AI Document Explorer. Dit is een privé-instantie van een GPT-model volgens het “Retrieval Augemented Generation”-framework die we op de bestaande infrastructuur van de financiële instelling aansloten.
Aanpak
We richtten het dataverwerkingsproces als volgt in:
- Documenten van SharePoint worden opgehaald binnen de Azure-omgeving.
- De data van afbeeldingen, webpagina’s, PDF’s, PowerPoints, Word-documenten en Excelbestanden wordt omgezet naar leesbare tekst.
- Deze output wordt gesplitst in kleine stukken tekst en per stuk geïndexeerd. Ook wordt de semantische waarde per stuk tekst achterhaald door een slim algoritme en mee opgeslagen.
Daarnaast bouwden we een chatapplicatie om met de data te kunnen praten. Als een gebruiker een vraag stelt binnen deze app, worden de volgende stappen ondernomen:
- We zetten de vraag om in keywords die worden gebruikt om een top 10 van de geïndexeerde stukken tekst terug te geven die semantisch het meest op de keywords lijken.
- De teruggekregen stukken tekst sturen we samen met een system prompt (instructies) en de originele vraag naar het ChatGPT-model.
- Het antwoord van het model en de gebruikte stukken tekst geven we terug aan de gebruiker.
Doordat ChatGPT de gebruikte stukken tekst meegeeft, kan de gebruiker zien uit welke bron het antwoord komt en checken of het correct is.
Resultaat
In plaats van zelf te moeten zoeken naar antwoorden op ad hoc vragen en uitleg over specifieke processen die gevolgd moeten worden, kunnen medewerkers van de financiële instelling nu vragen stellen over zo’n 100.000 stukken tekst aan documentatie. Ze krijgen ‘menselijke’ antwoorden met bronvermelding en citaten. De output ziet er als volgt uit:
De informatie is sneller beschikbaar en de betrouwbaarheid wordt altijd geverifieerd door een medewerker. Zo wordt er efficiënter gewerkt en blijft de kwaliteit van het werk onverminderd hoog.
Meer weten?
Wil je ook veilig zoeken in je vertrouwelijke documenten met de AI Document Explorer? Joachim gaat graag met je in gesprek over de mogelijkheden.
Business Manager020 308 43 9006 23 59 83 71joachim.vanbiemen@digital-power.com
1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?
Meld je aan voor onze maillijst en blijf 'up to data':