Hoe vind je een fraude van 186.000 euro: steekproeven of data-analyse?
Elke keer als ik in een column iets over steekproeven wil uitleggen, niet te moeilijk maar ook niet te gemakkelijk, iets handigs, zoals waarom uitbreiden na het vinden van fouten nadelen heeft, krijg ik reacties die helemaal niet over steekproeven gaan.
Paul van Batenburg
Hele colleges controleleer krijg ik aangeboden, allerlei prachtige constructies met verschillende methoden voor verschillende deelmassa's, waarbij zwaar wordt gesteund op de vermoedelijke kwaliteit en de verschillen daar in. Zonder aan te geven of en hoe je die vermoedens achteraf kunt valideren en wat je doet als die validatie niet lukt. Ik krijg dan de indruk van die reacties dat men vindt dat professional judgement en slimme software veel efficiënter zijn dan steekproeven.
Maar daar gaat mijn column niet over: ik wil wat vertellen over steekproeven, want daar heb ik verstand van, en professional judgment heb ik niet.
Natuurlijk moet je bij het controleren nadenken (voordat je een steekproef trekt). Natuurlijk moet je zaken die je integraal kunt checken, ook integraal doen. Ik ben nog steeds verbaasd over die collega die dankzij een data-analysetool niet meer met een steekproef hoefde te controleren of prijs maal hoeveelheid in de voorraadlijst wel gelijk was aan waarde. Pas op het moment dat de soll-positie van een bestand niet onafhankelijk en bewezen correct elektronisch beschikbaar is komen steekproeven aan de orde.
Daarom maar eens een casus: de gemeente Amsterdam die door factuurfraude achteraf onterecht 186.000 naar een Brabantse man overmaakte en nu probeert dat geld via de rechter terug te vorderen.
Hoe vind je een fraude van 186.000?
Een systematische steekproef met een interval van € 186.000 zal met 100 procent kans alle posten van € 186.000 of groter bevatten. Zo'n steekproef hoort bij een toegelaten afwijking van € 558.000, dus bij een uitvoeringsmaterialiteit van - pak 'm beet - € 750.000.
Bij deze de uitdaging voor de data-analyseadepten: zijn er, behalve een query op Brabanders, of een query op alle posten van € 186.000, efficiëntere manieren om met data-analyse deze fraude te ontdekken?
Gerelateerd
Machine learning in de audit: stratificeren van bedrijfslocaties
In dit derde en laatste deel van een reeks columns over machine learning in de audit gaat het over clusteren. De auteurs laten zien hoe je met een open-source statistiekprogramma...
Machine learning in de audit: uitschieters bij vastgoedwaardering
Regressie is een vorm van machine learning met als doel het voorspellen van cijfers op basis van een aantal kenmerken. Met open-sourcesoftware kun je zonder programmeerkennis...
Machine learning in de audit: voorspellen van klantverloop
Het doel van machine learning is om voorspellingen te maken aan de hand van data. Binnen dit veld worden doorgaans drie hoofdtoepassingen onderscheiden: classificatie,...
De steekproefomvang ontmaskerd - deel 5
In vorige columns hebben we verschillende manieren besproken om tot een steekproefomvang te kunnen komen. Deze column is de laatste van de serie waarin we verschillende...
De steekproefomvang ontmaskerd - deel 4
Een accountant die gebruikmaakt van software om een steekproefomvang te berekenen, moet zeker weten dat die software dat goed doet. Daarvoor moet je de rekenmethode...