De steekproefomvang ontmaskerd - deel 4
Een accountant die gebruikmaakt van software om een steekproefomvang te berekenen, moet zeker weten dat die software dat goed doet. Daarvoor moet je de rekenmethode begrijpen die de software gebruikt.
Niels van Leeuwen
Als auditor maak je ongetwijfeld wel eens gebruik van rekenbladen in Excel of auditsoftware om een steekproefomvang te berekenen. Dit soort middelen maken gebruik van algoritmes om deze berekeningen geautomatiseerd uit te voeren. Het is goed om te beseffen hoe deze middelen tot een bepaalde uitkomst komen. Je bent als auditor namelijk verantwoordelijk dat je voldoende werk hebt gedaan om een conclusie te trekken over het controleobject van de opdracht. Als de rekenmethodes niet deugen kan het voorkomen dat je te weinig hebt gedaan en materiële fouten over het hoofd hebt gezien. Je kunt je dan niet verschuilen achter de ontwikkelaar van de rekenmethode. Je moet begrijpen hoe deze middelen in elkaar zitten om vast te stellen dat ze juist werken.
In deze column kijken we naar een van de manieren hoe software een steekproefomvang kan bepalen. Het doel is je inzicht hierin te geven zodat je met voldoende vertrouwen op de uitkomst kunt steunen. Deze column is deel van een serie columns waarin we stil staan bij het berekenen van de steekproefomvang. Deze column laat zien hoe software tot een steekproefomvang kan komen. Dit doen we door eerst uit te leggen hoe de steekproef handmatig berekend kan worden en vervolgens wordt aangegeven hoe dit geautomatiseerd kan worden.
Handmatig
In eerdere columns hebben we stilgestaan bij de rekenformules waarmee een steekproefomvang berekend kan worden. We hebben toegelicht dat je een steekproef kunt berekenen met formules van een drietal kansverdelingen, te weten de:
- Hypergeometrische verdeling
- Binomiale verdeling
- Poisson verdeling
Deze formules maken allemaal gebruik van de volgende parameters:
- De populatieomvang (N)
- De materialiteit (p)
- Het aantal verwachte fouten in de steekproef (k)
- De steekproefomvang (n)
We hebben gezien dat de uitkomst van deze formules het risico op het onterecht goedkeuren van de massa is, oftewel het beta-risico (β).
Als we een jaarrekeningonderdeel willen controleren met een steekproef moeten we de steekproefomvang bepalen waarmee we voldoende zekerheid behalen. Als we een gewenste betrouwbaarheid in gedachten hebben, dan kunnen we drie van de vier bovengenoemde parameters vooraf bepalen, te weten de populatieomvang, de materialiteit en het aantal verwachte fouten. De enige parameter die onbekend is, is dan de steekproefomvang.
We kunnen de minimaal benodigde steekproefomvang bepalen met een iteratiemethode. Dit doe je door eerst de kleinst mogelijke steekproef in te vullen in de formule. Het startpunt is dan dus een steekproefomvang van slechts 1 post. Als we vervolgens de formule uitrekenen zien we direct of het gewenste betrouwbaarheidsniveau is bereikt. Hoogst waarschijnlijk zal dit nog niet het geval zijn met 1 post. Zolang dit nog niet het geval is, verhogen we de steekproef steeds met 1 post. Dit heeft tot gevolg dat de uitkomst van de formule steeds dichter bij het gewenste betrouwbaarheidsniveau komt.
We kunnen dit inzichtelijk maken met een voorbeeld. Voor dit voorbeeld hebben we gegevens nodig. We kunnen de gegevens gebruiken die we ook in eerdere columns hebben gehanteerd. Dit waren de volgende gegevens:
- β = 5%
- N = 1.000.000
- p = 5%
- k = 0
We kunnen deze parameters invullen in Excel met de volgende formules:
Verdeling | Functie |
Binomiaal | 95% ≤ 1 - BINOM.VERD(k; n; p; 1) |
Hypergeometrisch | 95% ≤ 1 - HYPGEOM.VERD(k; n; K; N, 1) |
Poisson | 95% ≤ 1 - POISSON.VERD(k; n*p, 1) |
Als we de binomiale verdeling gebruiken kunnen we de volgende tabel maken:
Betrouwbaarheid | k | n | β |
5% | 0 | 1 | 5% |
40% | 0 | 10 | 5% |
95% | 0 | 60 | 5% |
We zien dat een steekproefomvang van 1 slechts leidt tot een betrouwbaarheidspercentage van 5%. Dat is natuurlijk veel te laag, want met een b van 5% willen we minimaal 95% betrouwbaarheid behalen. Als we de steekproefomvang verhogen van 1 naar 10 wordt het betrouwbaarheidspercentage al beter, namelijk 40%. Bij een steekproefomvang van 60 behalen we het gewenste betrouwbaarheidspercentage van 95%.
Algoritmes
Softwarepakketten maken ons leven makkelijker door deze handmatige handeling te automatiseren doormiddel van geprogrammeerde algoritmes. Een algoritme is in feite niets anders dan een opdracht voor de computer om een aantal stappen voor ons uit te voeren. Je geeft de computer een aantal parameters mee en laat hem dan herhaaldelijk de berekening uitvoeren. Feitelijk gebeurt dan exact hetzelfde als we hierboven hebben gezien. Zolang de uitkomst van de berekening onder het gewenste betrouwbaarheidspercentage ligt, laat je de computer de steekproefomvang verhogen. Wanneer het gewenste betrouwbaarheidspercentage is bereikt, kun je de computer de steekproefomvang terug laten geven.
Het algoritme wat we hier gebruiken wordt met de Engelse term 'Brute Force' aangeduid. Het houdt in dat de computer alle mogelijke scenario’s afgaat tot het gewenste resultaat is bereikt. Dit is een van de algoritmes die softwareprogramma's gebruiken om te komen tot een minimale steekproefomvang. Zoals we in de eerdere columns hebben gezien is dit echter niet de enige manier om tot een steekproefomvang te komen. Een van de alternatieven is gebruikmaken van de np-waarde uit de inverse gamma formule. Op die manier zou een softwarepakket bijvoorbeeld ook tot een steekproefomvang kunnen komen. Het zal per pakket verschillen welk algoritme achter de schermen draait.
Brute force algoritmes hebben als voordeel dat ze ten opzichte van andere algoritmes relatief goed te doorgronden zijn. Ze staan echter ook bekend als inefficiënte algoritmes omdat ze alle opties afgaan voordat ze bij het juiste antwoord komen. Het is daarom ook een relatief traag algoritme, omdat de computer voor iedere berekening die het doet tijd moet nemen. Voor het berekenen van een steekproefomvang zul je daar echter weinig hinder van ondervinden, aangezien computers in deze tijd heel snel door de berekeningen schiet. Voor je het door hebt, heeft je computer enkele honderden keren de berekening gemaakt en heb je de juiste steekproefomvang op je scherm staan.
Je weet nu hoe software tot een steekproefomvang kan komen. Je kan daardoor met voldoende vertrouwen gebruik maken van rekenbladen of softwarepakketten die gebruik maken van brute-force-algoritmes. Je kunt hierdoor ook rekenbladen en software kritisch beoordelen, zodat je met voldoende vertrouwen gebruik kan maken van deze middelen.
Je hebt in de eerste column meerdere manieren geleerd om tot een steekproefomvang te komen. De tweede column leerde je hoe je in Excel op drie manieren tot een steekproefomvang kunt komen. In de derde column heb je de inverse functies zelf nagerekend, zodat je met vertrouwen kunt steunen op deze functies. In deze column heb je geleerd hoe je algoritmes kunt schrijven om tot een steekproef te kunnen komen.
In de volgende en laatste column laten we zien hoe je het open-sourcesoftwarepakket JASP kunt gebruiken om tot de juiste steekproefomvang te komen. Voor geïnteresseerden is in de bijlagen van deze column nog een instructie opgenomen hoe je in Excel zelf een algoritme kunt bouwen die het bovenstaande in de praktijk toepast. Daarnaast is een Excel opgenomen waarin het bovenstaande al is uitgewerkt.
Bijlagen
Steekproefalgoritmes in Excel & Steekproefberekening (zip-bestand)
Referenties
Stewart, Trevor. R. (2012). Technical Notes on the AICPA Audit Guide Audit Sampling. American Institute of Certified Public Accountants, New York.
Gerelateerd
Machine learning in de audit: stratificeren van bedrijfslocaties
In dit derde en laatste deel van een reeks columns over machine learning in de audit gaat het over clusteren. De auteurs laten zien hoe je met een open-source statistiekprogramma...
Machine learning in de audit: uitschieters bij vastgoedwaardering
Regressie is een vorm van machine learning met als doel het voorspellen van cijfers op basis van een aantal kenmerken. Met open-sourcesoftware kun je zonder programmeerkennis...
Machine learning in de audit: voorspellen van klantverloop
Het doel van machine learning is om voorspellingen te maken aan de hand van data. Binnen dit veld worden doorgaans drie hoofdtoepassingen onderscheiden: classificatie,...
De steekproefomvang ontmaskerd - deel 5
In vorige columns hebben we verschillende manieren besproken om tot een steekproefomvang te kunnen komen. Deze column is de laatste van de serie waarin we verschillende...
Symposium: Machine Learning in de audit
Hoe is het momenteel gesteld met de toepassing van Machine Learning in de audit? Aankondiging van een symposium.