Data-analyse

Data-analyse (nader) geanalyseerd (III)

Hoe overbruggen we de kloof tussen accountant en dataspecialist? Na ruim twee jaar is het tijd voor deel 3 van een serie artikelen over data-analyse. In het eerste artikel werd de buitenste ring van het 'VTA-model' toegelicht en in het tweede artikel de twee binnenste ringen. Nu worden de toepassingen van het VTA-model besproken.

Eric Mantelaers en Martijn Zoet

Om de context te schetsen nog even kort de kern van de vorige twee artikelen. Het VTA-model maakt het mogelijk het containerbegrip ‘data-analyse’ concreet in verschillende categorieën te onderscheiden. Het is een hulpmiddel dat door het beantwoorden van drie vragen komt tot de specifieke data-analyse die de persoon in kwestie wil uitvoeren.

Het model begint altijd in de binnenste cirkel, waarbij de vraag wordt gesteld welk element er geanalyseerd moet worden: een proces, een beslissing of een object? Wanneer er wordt gekozen voor een procesanalyse, wordt aanvullend de vraag gesteld wat je wil analyseren met betrekking tot dit proces (tweede ring). Wil je een proces voor het eerst ontdekken, wil je het controleren tegen een vastgestelde norm of wil je een proces verbeteren? Wanneer dit bepaald is, wordt naar de derde ring gegaan, waarin je de mate kunt bepalen waarin je het gewenste (bepaald in de eerste twee ringen) kan meten. In dit artikel wordt één van de toepassingen van het VTA-model gedemonstreerd.

De eerste vraag, voordat je welk model dan ook wilt gaan toepassen, is altijd: waarvoor kan ik het model eigenlijk gebruiken? Bij het VTA-model is dit niet anders. De redenen waarvoor het VTA-model onder andere wordt toegepast zijn:

  1. Een gestructureerde manier om effectiever en efficiënter tot eenduidige concrete vragen voor je data-analyse traject te komen
  2. Een gestructureerde manier om de ‘requirements’ voor een analysetool te formuleren en/of te evalueren
  3. Een gestructureerde manier om de analyse ‘capabilities’ binnen een afdeling te bepalen en/of te evalueren
  4. Een gestructureerde manier om de mogelijke visualisaties voor het tonen van het antwoord op een analysevraag te bepalen
  5. Een gestructureerde manier om de mogelijke algoritmes voor het tonen van het antwoord op een analysevraag te bepalen.

Komen tot éénduidige concrete analysevragen

In dit artikel wordt een demonstratie van de eerste toepassing gegeven. In de accountantspraktijk is er altijd wel een idee over wat er geanalyseerd moet gaan worden. Stel dat je als accountant vragen hebt met betrekking tot het inkoopproces, maar voor de rest ben je niet goed ingevoerd in het daadwerkelijk uitvoeren van data-analyse. Dan kunnen er allerlei vragen tot je komen: Welk programma moet ik gebruiken? Welk algoritme moet ik gebruiken? Of welke visualisatie moet ik gebruiken? Stuk voor stuk uitermate valide vragen, maar de belangrijkste vraag die beantwoord moet worden is: “Welke analysevraag wil ik beantwoorden?”

Ter beantwoording van deze vraag kan het VTA-model worden gebruikt, om vervolgens te bepalen welke tools, visualisaties en algoritmes het meest geschikt zijn.

Data-analyse (nader) geanalyseerd (III) - figuur 1 - 760px

(figuur 1: VTA-model)

Om te komen tot gestructureerde analysevragen moet er eerst uit elke cirkel van het VTA-model een element (vakje) worden geselecteerd. Hiervoor worden drie vragen gesteld. Ten eerste de vraag: wat wil ik analyseren? In het voorliggende voorbeeld kiezen we (uit cirkel 1) voor een proces (inkopen). Daarna is het van belang om te weten waarom ik het gewenste wil analyseren? Omdat het hier gaat om een controle, kiezen we (uit cirkel 2) voor de keuze ‘controleren’. Ten derde dient zich de vraag aan welk algoritme (een aantal nauwkeuring gedefinieerde rekenregels) en welke manier van visualiseren gekozen moeten worden. Ervan uitgaande dat jij als accountant nog geen idee hebt hoe het huidige (inkoop) proces eruitziet, of welke verbanden er zijn, wordt er nu (uit cirkel 3) als eerste gekozen voor ‘beschrijven’ (zie figuur 1).

Nu elk van de drie vragen is beantwoord, hebben we een zogenaamd analysepatroon: proces – controleren – beschrijven (PCB). Aan dit analysepatroon zitten verschillende analysevraagpatronen gekoppeld, die weer zijn opgedeeld in verschillende categorieën (figuur 2). Voorbeelden van categorieën zijn: volgorde van activiteiten, rollen, tijd en geografisch. Elk van deze categorieën bestaat uit meerdere analysevraagpatronen. Voorbeelden hiervan zouden kunnen zijn: (in de categorie rollen) het uitvoeren van controles ten opzichte van rollen (was degene die besteld heeft, daartoe bevoegd?), of (in de categorie tijdcontroles) het uitvoeren van controles ten opzichte van tijd (heeft de betaling van de inkoopfactuur plaatsgevonden binnen de per crediteur afgesproken betaaltermijn)?

Data-analyse (nader) geanalyseerd (III) - figuur 2 - 760px

(figuur 2: Voorbeelden analysevraagpatronen)

Nadat op basis van het analysepatroon (PCB) een set van analysevraagpatronen is geselecteerd, moet er gekozen worden welk van deze patronen geschikt is om de analysevraag te formuleren. In dit voorbeeld is de analyse die moet worden uitgevoerd, de vraag of bepaalde activiteiten in het inkoopproces (bestellen, ontvangen, betalen e.d.) in een bepaalde volgorde zijn uitgevoerd. Dit betekent dat er gekozen wordt voor analysevraagpatroon PCB – 0003 (zie figuur 3). Wanneer een accountant de VTA-methode voor de eerste keer toepast, zal hij niet meteen weten welk analysevraagpatroon geschikt is. In dat geval zal er vaak naar meerdere patronen worden gekeken om te beoordelen welke het meest geschikt is.

Data-analyse (nader) geanalyseerd (III) - figuur 3 - 760px

(figuur 3: analysevraagpatroon proces – controleren – beschrijven – 0003)

In figuur 3 staat het analysevraagpatroon: proces – controleren – beschrijven (0003) weergegeven. Aan de bovenkant van de ‘kaart’ staat het patroon van de analysevraag en aan de onderkant wordt een voorbeeld weergegeven van een specifiek ingevulde vraag. In dit geval wordt als voorbeeld het inkoopproces gegeven waarin de volgorde van drie activiteiten wordt gecontroleerd (‘create purchase order item’ en ‘receive order confirmation’). Op basis van het patroon kunnen vragen specifiek voor de controleopdracht worden geformuleerd. Als hulpmiddel daarbij wordt het patroon in onderstaande ‘kaart’ (figuur 4) weergegeven, maar dan zonder de elementen die zelf bepaald kunnen worden. Een aantal andere voorbeeldvragen zou kunnen zijn:

Wat zijn de huidige varianten in de procesvolgorde (procesinstanties):three way match (uitgedrukt in een procesvariant) waarin de activiteiten plaatsen inkooporder’, ontvangen goederenen betalen factuur in volgorde zijn uitgevoerd?

De niet variabele stukken in het patroon (‘kaart’) zijn blijven staan, maar de variabele stukken zijn vervangen door andere voorbeelden. Nu staan er in dit voorbeeld drie activiteiten, maar zoals in de patroonbeschrijving te zien is, staat er activiteit ^N, wat betekent dat er ook vier, vijf, zes of meer activiteiten kunnen worden genoemd. Daarnaast hebben de groene en lichtblauwe kleur ook nog specifieke betekenissen, maar daar wordt in dit artikel niet verder op ingegaan.

Data-analyse (nader) geanalyseerd (III) - figuur 4 - 760px

(figuur 4: analysevraagpatroon proces hulpmiddel – controleren – beschrijven – 0003)

Wat kan ik met eenduidig geformuleerde analysevragen?

Wat kun je nu met de eenduidig geformuleerde analysevragen? Ten eerste, als je een (Business) Intelligence (BI), Datascience of Machine Learning afdeling hebt, maakt het de communicatie met dit type afdelingen eenvoudiger. Door de analysevragen op deze manier te formuleren krijgen zij op een eenduidige en gestructureerde manier aangeleverd welke analysevraag zij moeten beantwoorden.

Maar er is nog een bijkomend voordeel. Aan elk analysevraagpatroon zijn namelijk nog vier elementen gekoppeld:

  • de benodigde data-elementen om de analyse uit te kunnen voeren
  • de visualisatie om de vraag op het patroon te presenteren
  • de benodigde modellen of bedrijfsregels
  • de software en/of algoritmes, die deze vraag kan beantwoorden.

Door deze koppeling wordt het ‘requirements’ proces van data-analyse een stuk eenvoudiger gemaakt. Laten we dit door middel van het analysevraagpatroon PCB – 0003 kort illustreren. De data-elementen benodigd om deze vraag te kunnen beantwoorden zijn: Case-ID (uniek identificatienummer van een factuur), een datum plus tijdstempel en de activiteit zelf.

Case-ID Tijdstempel Activiteit
IF2020.345 12 december 9.05 Plaatsen inkooporder
IF2020.456 14 december 9.45 Betalen factuur
IF2020.943 18 december 10.45 Betalen factuur
IF2020.345 13 december 14:45 Betalen factuur
IF2020.456 18 december 9.45 Plaatsen inkooporder

(tabel 1: voorbeeld case tabel)

Daarnaast dient het antwoord op de vraag te worden gevisualiseerd. In dit specifieke geval bestaan er vele manieren van visualiseren die in de verschillende tools anders zijn. In figuur 5 en 6 zijn twee verschillende voorbeelden gegeven. De eerste visualisatie (figuur 5) komt uit DAOS en de tweede visualisatie uit het softwarepakket Minit (figuur 6).

Data-analyse (nader) geanalyseerd (III) - figuur 5 - 760px

(figuur 5: visualisatie DAOS)

Data-analyse (nader) geanalyseerd (III) - figuur 6 - 821px

(figuur 6: visualisatie Minit)

Bij de analysevraagpatronen van het type controleren zijn er daarnaast bedrijfsregels benodigd waartegen gecontroleerd dient te worden. In dit geval staat de bedrijfsregel al in de vraag, te weten: geef de processen waarin create purchase order item, receive order confirmation en clear invoice in volgorde zijn uitgevoerd. Het is afhankelijk van het softwarepakket/algoritme hoe deze bedrijfsregels in een specifieke situatie worden geïmplementeerd. In sommige gevallen gebeurt dit door het toepassen van filters, terwijl in andere gevallen de bedrijfsregels in gestructureerd Nederlands of door middel van decision model notation moeten worden ingevoerd.

Als laatste is het belangrijk om te weten welk algoritme of welke software deze vraag kan beantwoorden. In dit geval zijn er meerdere algoritmes, zoals het fuzzy algoritme of heuristic algoritme, die deze vragen kunnen beantwoorden. Aan de andere kant zijn er verschillende softwarepakketten, zoals: DAOS, PowerBI, Tablue, Qlik, Minit en nog vele andere. Met betrekking tot deze stap is het voor de accountant de vraag of hij hier iets vanaf moet weten, of dat hij dit aan een andere expert overlaat.

Nu er is toegelicht wat je met een eenduidig geformuleerde analysevraag kan, wordt nog in gegaan op wat er mogelijk is met een classificatie van type analysevragen.

Wat kan ik met een classificatie van type analysevragen?

Belangrijker dan de daadwerkelijk te beantwoorden analysevragen, is dat ze van een bepaald patroon zijn. Je kan namelijk als accountantsorganisatie (of -kantoor) een hele specifieke vraag implementeren, of software aanschaffen die een hele specifieke vraag beantwoordt. Veel belangrijker is echter om naar software te kijken die een type vraag beantwoordt (een specifiek patroon of een verzameling van specifieke patronen) en ervoor te zorgen dat deze software dan voor meerdere processen (inkoop, verkoop, en dergelijke) gebruikt kan worden. Dit geeft namelijk ook meteen een richting aan en visie op welke soorten analysecapaciteiten je als accountantsorganisatie wilt ontwikkelen.

Vervolgens is het belangrijk om inzichtelijk te krijgen welk type analysevragen (met welk type patronen) je reeds kunt beantwoorden en welke nog niet. En voor welke je daadwerkelijk al de capaciteiten in huis hebt. Deze score wordt de analyse quotiënt genoemd. Een dergelijke berekening kan uitmonden in een plaatje zoals figuur 7, waarin inzichtelijk wordt gemaakt welk type analysevragen al wel of nog niet kunnen worden beantwoord.

Voor het opstellen van een dergelijk model kun je gebruik maken van een periodiek systeem van het VTA-model (zie figuur 7). In het onderstaande model betekent grijs dat een accountantsorganisatie de analyse niet kan uitvoeren, groen dat het standaard is binnen elke controle en iedereen het kan uitvoeren, blauw dat het binnen elke controle wordt toegepast, maar er echte expertise nodig is. Geel betekent dat het niet binnen elke controle wordt uitgevoerd. Door deze scores te bepalen voor elk type, kun je een gedegen strategie inzetten van waar en hoe je moet gaan verbeteren.

Data-analyse (nader) geanalyseerd (III) - figuur 7 - 1364px

(figuur 7: periodiek systeem type analysevragen)

In dit artikel is de toepassing van het VTA-model (figuur 1) besproken, voor wat betreft het formuleren van eenduidige vragen (cirkel 3). Daarnaast is er ingegaan op de waaromvraag. Behalve het beschouwen van individuele analysevragen, is het ook belangrijk om naar verschillende typen vragen te kijken en in het bijzonder hoe je een onderscheid kunt aanbrengen tussen de vragen die je inmiddels wel/niet kunt beantwoorden.

Dr. Eric J.H.J. Mantelaers RA AA CISA C|CISO is als bijzonder lector verbonden aan het lectoraat 'Future-proof Auditor' van Zuyd Hogeschool. Ook is hij hoofd Bureau Vaktechniek en audit partner van RSM Netherlands Accountants. Tevens is hij als senior docent verbonden aan de accountantsopleiding van Maastricht University en aan Nyenrode Business Universiteit. Eric Mantelaers schrijft op persoonlijke titel.

Dr. ing. Martijn M. Zoet (1983) is als lector verbonden aan het lectoraat Future-proof Financial van Zuyd Hogeschool. Tevens is hij als managing partner verbonden aan EDM-Competence Centre. Martijn Zoet schrijft op persoonlijke titel.

Gerelateerd

reacties

Reageren op een artikel kan tot drie maanden na plaatsing. Reageren op dit artikel is daarom niet meer mogelijk.

Aanmelden nieuwsbrief

Ontvang elke werkdag (maandag t/m vrijdag) de laatste nieuwsberichten, opinies en artikelen in uw mailbox.

Bent u NBA-lid? Dan kunt u zich ook aanmelden via uw ledenprofiel op MijnNBA.nl.