Data-analyse (nader) geanalyseerd (III)
Hoe overbruggen we de kloof tussen accountant en dataspecialist? Na ruim twee jaar is het tijd voor deel 3 van een serie artikelen over data-analyse. In het eerste artikel werd de buitenste ring van het 'VTA-model' toegelicht en in het tweede artikel de twee binnenste ringen. Nu worden de toepassingen van het VTA-model besproken.
Eric Mantelaers en Martijn Zoet
Om de context te schetsen nog even kort de kern van de vorige twee artikelen. Het VTA-model maakt het mogelijk het containerbegrip ‘data-analyse’ concreet in verschillende categorieën te onderscheiden. Het is een hulpmiddel dat door het beantwoorden van drie vragen komt tot de specifieke data-analyse die de persoon in kwestie wil uitvoeren.
Het model begint altijd in de binnenste cirkel, waarbij de vraag wordt gesteld welk element er geanalyseerd moet worden: een proces, een beslissing of een object? Wanneer er wordt gekozen voor een procesanalyse, wordt aanvullend de vraag gesteld wat je wil analyseren met betrekking tot dit proces (tweede ring). Wil je een proces voor het eerst ontdekken, wil je het controleren tegen een vastgestelde norm of wil je een proces verbeteren? Wanneer dit bepaald is, wordt naar de derde ring gegaan, waarin je de mate kunt bepalen waarin je het gewenste (bepaald in de eerste twee ringen) kan meten. In dit artikel wordt één van de toepassingen van het VTA-model gedemonstreerd.
De eerste vraag, voordat je welk model dan ook wilt gaan toepassen, is altijd: waarvoor kan ik het model eigenlijk gebruiken? Bij het VTA-model is dit niet anders. De redenen waarvoor het VTA-model onder andere wordt toegepast zijn:
- Een gestructureerde manier om effectiever en efficiënter tot eenduidige concrete vragen voor je data-analyse traject te komen
- Een gestructureerde manier om de ‘requirements’ voor een analysetool te formuleren en/of te evalueren
- Een gestructureerde manier om de analyse ‘capabilities’ binnen een afdeling te bepalen en/of te evalueren
- Een gestructureerde manier om de mogelijke visualisaties voor het tonen van het antwoord op een analysevraag te bepalen
- Een gestructureerde manier om de mogelijke algoritmes voor het tonen van het antwoord op een analysevraag te bepalen.
Komen tot éénduidige concrete analysevragen
In dit artikel wordt een demonstratie van de eerste toepassing gegeven. In de accountantspraktijk is er altijd wel een idee over wat er geanalyseerd moet gaan worden. Stel dat je als accountant vragen hebt met betrekking tot het inkoopproces, maar voor de rest ben je niet goed ingevoerd in het daadwerkelijk uitvoeren van data-analyse. Dan kunnen er allerlei vragen tot je komen: Welk programma moet ik gebruiken? Welk algoritme moet ik gebruiken? Of welke visualisatie moet ik gebruiken? Stuk voor stuk uitermate valide vragen, maar de belangrijkste vraag die beantwoord moet worden is: “Welke analysevraag wil ik beantwoorden?”
Ter beantwoording van deze vraag kan het VTA-model worden gebruikt, om vervolgens te bepalen welke tools, visualisaties en algoritmes het meest geschikt zijn.
(figuur 1: VTA-model)
Om te komen tot gestructureerde analysevragen moet er eerst uit elke cirkel van het VTA-model een element (vakje) worden geselecteerd. Hiervoor worden drie vragen gesteld. Ten eerste de vraag: wat wil ik analyseren? In het voorliggende voorbeeld kiezen we (uit cirkel 1) voor een proces (inkopen). Daarna is het van belang om te weten waarom ik het gewenste wil analyseren? Omdat het hier gaat om een controle, kiezen we (uit cirkel 2) voor de keuze ‘controleren’. Ten derde dient zich de vraag aan welk algoritme (een aantal nauwkeuring gedefinieerde rekenregels) en welke manier van visualiseren gekozen moeten worden. Ervan uitgaande dat jij als accountant nog geen idee hebt hoe het huidige (inkoop) proces eruitziet, of welke verbanden er zijn, wordt er nu (uit cirkel 3) als eerste gekozen voor ‘beschrijven’ (zie figuur 1).
Nu elk van de drie vragen is beantwoord, hebben we een zogenaamd analysepatroon: proces – controleren – beschrijven (PCB). Aan dit analysepatroon zitten verschillende analysevraagpatronen gekoppeld, die weer zijn opgedeeld in verschillende categorieën (figuur 2). Voorbeelden van categorieën zijn: volgorde van activiteiten, rollen, tijd en geografisch. Elk van deze categorieën bestaat uit meerdere analysevraagpatronen. Voorbeelden hiervan zouden kunnen zijn: (in de categorie rollen) het uitvoeren van controles ten opzichte van rollen (was degene die besteld heeft, daartoe bevoegd?), of (in de categorie tijdcontroles) het uitvoeren van controles ten opzichte van tijd (heeft de betaling van de inkoopfactuur plaatsgevonden binnen de per crediteur afgesproken betaaltermijn)?
(figuur 2: Voorbeelden analysevraagpatronen)
Nadat op basis van het analysepatroon (PCB) een set van analysevraagpatronen is geselecteerd, moet er gekozen worden welk van deze patronen geschikt is om de analysevraag te formuleren. In dit voorbeeld is de analyse die moet worden uitgevoerd, de vraag of bepaalde activiteiten in het inkoopproces (bestellen, ontvangen, betalen e.d.) in een bepaalde volgorde zijn uitgevoerd. Dit betekent dat er gekozen wordt voor analysevraagpatroon PCB – 0003 (zie figuur 3). Wanneer een accountant de VTA-methode voor de eerste keer toepast, zal hij niet meteen weten welk analysevraagpatroon geschikt is. In dat geval zal er vaak naar meerdere patronen worden gekeken om te beoordelen welke het meest geschikt is.
(figuur 3: analysevraagpatroon proces – controleren – beschrijven – 0003)
In figuur 3 staat het analysevraagpatroon: proces – controleren – beschrijven (0003) weergegeven. Aan de bovenkant van de ‘kaart’ staat het patroon van de analysevraag en aan de onderkant wordt een voorbeeld weergegeven van een specifiek ingevulde vraag. In dit geval wordt als voorbeeld het inkoopproces gegeven waarin de volgorde van drie activiteiten wordt gecontroleerd (‘create purchase order item’ en ‘receive order confirmation’). Op basis van het patroon kunnen vragen specifiek voor de controleopdracht worden geformuleerd. Als hulpmiddel daarbij wordt het patroon in onderstaande ‘kaart’ (figuur 4) weergegeven, maar dan zonder de elementen die zelf bepaald kunnen worden. Een aantal andere voorbeeldvragen zou kunnen zijn:
Wat zijn de huidige varianten in de procesvolgorde (procesinstanties): ‘three way match’ (uitgedrukt in een procesvariant) waarin de activiteiten ‘plaatsen inkooporder’, ‘ontvangen goederen’ en ’betalen factuur’ in volgorde zijn uitgevoerd?
De niet variabele stukken in het patroon (‘kaart’) zijn blijven staan, maar de variabele stukken zijn vervangen door andere voorbeelden. Nu staan er in dit voorbeeld drie activiteiten, maar zoals in de patroonbeschrijving te zien is, staat er activiteit ^N, wat betekent dat er ook vier, vijf, zes of meer activiteiten kunnen worden genoemd. Daarnaast hebben de groene en lichtblauwe kleur ook nog specifieke betekenissen, maar daar wordt in dit artikel niet verder op ingegaan.
(figuur 4: analysevraagpatroon proces hulpmiddel – controleren – beschrijven – 0003)
Wat kan ik met eenduidig geformuleerde analysevragen?
Wat kun je nu met de eenduidig geformuleerde analysevragen? Ten eerste, als je een (Business) Intelligence (BI), Datascience of Machine Learning afdeling hebt, maakt het de communicatie met dit type afdelingen eenvoudiger. Door de analysevragen op deze manier te formuleren krijgen zij op een eenduidige en gestructureerde manier aangeleverd welke analysevraag zij moeten beantwoorden.
Maar er is nog een bijkomend voordeel. Aan elk analysevraagpatroon zijn namelijk nog vier elementen gekoppeld:
- de benodigde data-elementen om de analyse uit te kunnen voeren
- de visualisatie om de vraag op het patroon te presenteren
- de benodigde modellen of bedrijfsregels
- de software en/of algoritmes, die deze vraag kan beantwoorden.
Door deze koppeling wordt het ‘requirements’ proces van data-analyse een stuk eenvoudiger gemaakt. Laten we dit door middel van het analysevraagpatroon PCB – 0003 kort illustreren. De data-elementen benodigd om deze vraag te kunnen beantwoorden zijn: Case-ID (uniek identificatienummer van een factuur), een datum plus tijdstempel en de activiteit zelf.
Case-ID | Tijdstempel | Activiteit |
IF2020.345 | 12 december 9.05 | Plaatsen inkooporder |
IF2020.456 | 14 december 9.45 | Betalen factuur |
IF2020.943 | 18 december 10.45 | Betalen factuur |
IF2020.345 | 13 december 14:45 | Betalen factuur |
IF2020.456 | 18 december 9.45 | Plaatsen inkooporder |
(tabel 1: voorbeeld case tabel)
Daarnaast dient het antwoord op de vraag te worden gevisualiseerd. In dit specifieke geval bestaan er vele manieren van visualiseren die in de verschillende tools anders zijn. In figuur 5 en 6 zijn twee verschillende voorbeelden gegeven. De eerste visualisatie (figuur 5) komt uit DAOS en de tweede visualisatie uit het softwarepakket Minit (figuur 6).
(figuur 5: visualisatie DAOS)
(figuur 6: visualisatie Minit)
Bij de analysevraagpatronen van het type controleren zijn er daarnaast bedrijfsregels benodigd waartegen gecontroleerd dient te worden. In dit geval staat de bedrijfsregel al in de vraag, te weten: geef de processen waarin create purchase order item, receive order confirmation en clear invoice in volgorde zijn uitgevoerd. Het is afhankelijk van het softwarepakket/algoritme hoe deze bedrijfsregels in een specifieke situatie worden geïmplementeerd. In sommige gevallen gebeurt dit door het toepassen van filters, terwijl in andere gevallen de bedrijfsregels in gestructureerd Nederlands of door middel van decision model notation moeten worden ingevoerd.
Als laatste is het belangrijk om te weten welk algoritme of welke software deze vraag kan beantwoorden. In dit geval zijn er meerdere algoritmes, zoals het fuzzy algoritme of heuristic algoritme, die deze vragen kunnen beantwoorden. Aan de andere kant zijn er verschillende softwarepakketten, zoals: DAOS, PowerBI, Tablue, Qlik, Minit en nog vele andere. Met betrekking tot deze stap is het voor de accountant de vraag of hij hier iets vanaf moet weten, of dat hij dit aan een andere expert overlaat.
Nu er is toegelicht wat je met een eenduidig geformuleerde analysevraag kan, wordt nog in gegaan op wat er mogelijk is met een classificatie van type analysevragen.
Wat kan ik met een classificatie van type analysevragen?
Belangrijker dan de daadwerkelijk te beantwoorden analysevragen, is dat ze van een bepaald patroon zijn. Je kan namelijk als accountantsorganisatie (of -kantoor) een hele specifieke vraag implementeren, of software aanschaffen die een hele specifieke vraag beantwoordt. Veel belangrijker is echter om naar software te kijken die een type vraag beantwoordt (een specifiek patroon of een verzameling van specifieke patronen) en ervoor te zorgen dat deze software dan voor meerdere processen (inkoop, verkoop, en dergelijke) gebruikt kan worden. Dit geeft namelijk ook meteen een richting aan en visie op welke soorten analysecapaciteiten je als accountantsorganisatie wilt ontwikkelen.
Vervolgens is het belangrijk om inzichtelijk te krijgen welk type analysevragen (met welk type patronen) je reeds kunt beantwoorden en welke nog niet. En voor welke je daadwerkelijk al de capaciteiten in huis hebt. Deze score wordt de analyse quotiënt genoemd. Een dergelijke berekening kan uitmonden in een plaatje zoals figuur 7, waarin inzichtelijk wordt gemaakt welk type analysevragen al wel of nog niet kunnen worden beantwoord.
Voor het opstellen van een dergelijk model kun je gebruik maken van een periodiek systeem van het VTA-model (zie figuur 7). In het onderstaande model betekent grijs dat een accountantsorganisatie de analyse niet kan uitvoeren, groen dat het standaard is binnen elke controle en iedereen het kan uitvoeren, blauw dat het binnen elke controle wordt toegepast, maar er echte expertise nodig is. Geel betekent dat het niet binnen elke controle wordt uitgevoerd. Door deze scores te bepalen voor elk type, kun je een gedegen strategie inzetten van waar en hoe je moet gaan verbeteren.
(figuur 7: periodiek systeem type analysevragen)
In dit artikel is de toepassing van het VTA-model (figuur 1) besproken, voor wat betreft het formuleren van eenduidige vragen (cirkel 3). Daarnaast is er ingegaan op de waaromvraag. Behalve het beschouwen van individuele analysevragen, is het ook belangrijk om naar verschillende typen vragen te kijken en in het bijzonder hoe je een onderscheid kunt aanbrengen tussen de vragen die je inmiddels wel/niet kunt beantwoorden.
Gerelateerd
Coney Minds start website over AI, machine learning en data-analyse
Accountantskantoor Coney Minds lanceert TheDataConnection, een website die ontwikkelingen op het gebied van kunstmatige intelligentie (AI), machine learning en data-analyse...
Ministerraad stemt in met voorstel voor uitvoering Europese Data Act
De ministerraad heeft besloten om het wetsvoorstel voor de Nederlandse uitvoeringswetgeving van de Europese Data Act voor advies naar de Raad van State te zenden....
'Data en AI steeds belangrijker directieonderdeel'
Volgens 65 procent van alle directieleden met AI- en dataverantwoordelijkheden bestond hun functie vijf jaar geleden niet. Dit is een forse daling ten opzichte van...
'Controle van de toekomst': meer samenwerken en vooruitkijken
Peter Wennink (ceo ASML) noemde onze samenleving onlangs 'dik, dom en blij' op het gebied van technologische ontwikkeling. Volgens hem moeten we meer samenwerken...
'Accountants worstelen met overstap naar datagestuurde processen'
Het gebruikmaken van data science in de accountancy is nog relatief beperkt. Accountants zijn gewend aan traditionele documentgerichte benaderingen en worstelen...