Statistical auditing (95)

De steekproefomvang ontmaskerd - een introductie

Steekproefomvangen berekenen doen we meestal met rekenbladen in Excel of statistische software. Hoewel velen van ons statistiek hebben gehad, is het berekenen van de steekproefomvang in de audit toch lastig. Met een nieuwe serie columns helderen we de methodes op.

Niels van Leeuwen

Rekenbladen en software geven je wel een uitkomst, maar er wordt zelden uitgelegd hoe tot deze uitkomst is gekomen. Instructies en handboeken zijn soms geschreven door collega's die al jaren niet meer werken bij jouw organisatie. Met wat moeilijke termen hier en daar lijkt het wel een mysterie hoe je tot een goed onderbouwde steekproefomvang moet komen. Zonder duidelijke uitleg over hoe je deze omvang berekent is het risico dat je een fout maakt groot. Maar als de methodes helder zijn, dan ontrafelt het mysterie zich en kun je met veel meer vertrouwen gebruik maken van statistiek in je opdracht.

Deze column is onderdeel van een serie van vijf waarin we verschillende steekproefomvang berekeningen behandelen. Deze eerste column is een introductie van kernbegrippen van statistiek en geeft weer welke verschillende berekeningen er zijn. Het doel van deze column is om te begrijpen welke berekeningen je kunt toepassen.

De tweede column laat zien hoe je in Excel een steekproefomvang kunt uitrekenen met verschillende rekenmethodes. Het doel van deze column is dat je zelfstandig kunt komen tot een steekproefomvang. De derde column laat zien hoe je in bepaalde gevallen zelfs handmatig een steekproefomvang kunt berekenen. Het doel hiervan is een beter begrip te geven van de formules die je in Excel hebt gebruikt bij de vorige column. De vierde column laat zien hoe je middels algoritmes in VBA de berekeningen kunt automatiseren. Het doel hiervan is inzicht te geven hoe software tot een bepaalde steekproefomvang komt, zodat je hier met voldoende vertrouwen op kunt steunen. De vijfde en laatste column laat zien hoe je deze berekeningen in het (gratis) open source softwarepakket JASP kunt uitvoeren.

Het doel van de gehele serie is dat je kennis opdoet van de meest gebruikte berekeningen om te komen tot een steekproefomvang en in staat bent deze zelfstandig uit te voeren. Je kunt hierdoor de uitgangspunten die je doet bij het opstellen van een steekproefomvang-berekening goed onderbouwen.

Audit en statistiek

Laten we eerst kijken naar de relatie tussen audit en statistiek. Als auditor willen we met voldoende mate van zekerheid een conclusie trekken dat een object van onderzoek vrij is van materiële fouten of onzekerheden. De statistiek leert ons hoe wij met een steekproef met een beperkt aantal waarnemingen met voldoende betrouwbaarheid een conclusie kunnen trekken over een populatie. Beide invalshoeken komen samen tot één definitie van het doel van steekproeven in de audit. We willen dan met een beperkt aantal waarnemingen met voldoende betrouwbaarheid de conclusie trekken dat een object van onderzoek vrij is van materiële fouten en onzekerheden. De vraag die je hierbij kunt stellen is: bij hoeveel waarnemingen kan ik met voldoende zekerheid een uitspraak doen? Dit is waar statistische berekeningen om de hoek komen.

Soorten berekeningen

Er zijn verschillende manieren om tot een steekproefomvang te komen. Statistiek is een breed vakgebied. Voor specifieke vraagstukken bestaan ook specifieke oplossingen. Dit geldt ook voor de toepassing van statistiek in de audit. Om een goed beeld te krijgen van deze verschillende manieren gaan we eerst in op het verschil tussen continue en discrete data. Als we dit hebben gedaan kunnen we ons een goed beeld vormen van welke methodes dan van toepassing zijn op audits.

Discrete en continue data
De normale verdeling is het meest onderwezen model in de statistiek. Maar voor ons onderwerp is dit model minder goed van toepassing. Het kenmerkende van de normale verdeling is de klokvormige kansverdeling, waarbij veel waarnemingen rond het gemiddelde vallen en de kans op waarnemingen die van het gemiddelde af liggen steeds verder afneemt. Deze gemiddeldes en afwijkingen kun je opdelen in steeds kleinere stukjes. De normale verdeling is om deze reden een verdeling gebaseerd op continue data. In plaats van het meten of iets dicht bij het gemiddelde valt, willen we bij de audit weten of onze waarnemingen goed of fout zijn. We classificeren dus data en dat is iets wezenlijk anders. Informatie met classificaties zoals goed of fout noemen we discrete data. Voor ons vraagstuk moeten we dus berekeningen zoeken die discrete data behandelen.

In de statistiek denkt men bij discrete data bijvoorbeeld aan een zak knikkers met twee of meer kleuren. Om deze berekeningen toe te kunnen passen moeten we eerst de aanname doen dat onze populatie vergelijkbaar is met een zak knikkers met twee kleuren. Onze populatie is dan een zak euro's met twee mogelijke eigenschappen: goed of fout gepresenteerde euro's. Met deze aanname kunnen we verder kijken naar welke berekeningen toepasbaar zijn.

Toepasbare berekeningen
Er zijn tal van discrete verdelingen, maar drie zijn goed toepasbaar voor de audit. Dit zijn de hypergeometrische verdeling, de binomiale verdeling en de Poisson-verdeling. De reden dat specifiek deze drie verdelingen goed passen, is omdat al deze drie verdelingen kijken naar meerdere waarnemingen die te classificeren zijn in twee groepen. Er zijn namelijk ook verdelingen die kijken naar meer dan twee mogelijkheden, wat voor ons vraagstuk niet relevant is.

Voor iedere verdeling bestaan goede argumenten om deze te gebruiken. Het hangt allemaal af van de aard van de verdeling die je neemt en hoe zich dat verhoudt tot wat wij in de audit doen. Laten we hier per verdeling wat dieper op ingaan.

Hypergeometrische verdeling
De hypergeometrische verdeling kijkt naar meerdere waarnemingen die goed of fout kunnen zijn en gaat ervan uit dat je waarnemingen niet terug stopt in je populatie voordat je een nieuwe waarneming doet. Dit wordt zonder teruglegging genoemd. Dit is de meest passende verdeling voor wat we in de audit doen. Je controleert namelijk een selectie van euro's die je beoordeelt en vervolgens op een aparte lijst bijhoudt. Je stopt de waarnemingen niet meer terug in de populatie en hebt zo dus ook niet de kans dat je dezelfde post dubbel trekt. Deze methode vertoont de meeste overeenkomsten met wat we daadwerkelijk in de audit doen. Echter er bestaan relatief weinig rekenmethodes voor de berekening van de steekproefomvang.

Binomiale verdeling
Bij de binomiale verdeling is ook sprake van waarnemingen die in goed of fout worden geclassificeerd, maar bij deze verdeling is er wel sprake van teruglegging. Als je dit letterlijk zou toepassen binnen de audit, dan zou je een post op een willekeurige manier moeten selecteren, controleren of deze goed of fout is en dan vervolgens terug stoppen in je populatie van posten. Hierna neem je weer een willekeurige waarneming, met de kans dat je dezelfde post trekt. Deze methode lijkt erg op wat we daadwerkelijk in de audit doen met het verschil dat we meestal niet terugleggen in de audit. Ook hier bestaan relatief weinig rekenmethodes voor de berekening van de steekproefomvang.

De Poisson-verdeling
Bij de Poisson-verdeling kijk je niet naar een waarneming los, maar naar een telling van het aantal fouten per interval. Deze verdeling is bedacht om tellingen te doen in de tijd, bijvoorbeeld hoeveel auto's een kruispunt in één uur passeren. In de audit kunnen wij dit vertalen naar hoeveel foute euro's we vaststellen in vaste intervallen van euro's in de populatie. Hoewel er bij toepassing van de Poisson-verdeling in de literatuur niet vaak wordt gesproken over teruglegging, kun je aannemen dat hier wel sprake is van teruglegging, omdat eenzelfde auto ook meerdere keren over een kruispunt kan rijden.

Voor de Poisson-verdeling is de berekening van de steekproefomvang relatief eenvoudig ten opzichte van die voor de hypergeometrische of binomiale verdeling. Toepassing vraagt echter een vertaling van aantallen fouten naar het aantal foute euro's per interval.

Verschillen beperkt

We zijn ingegaan op de verschillen tussen de drie methodes. Echter in de uitwerking naar berekening van de steekproefomvang voor de audit zijn de verschillen beperkt. Dat komt omdat, zeker voor situaties met een klein aantal verwachte fouten en een grote steekproefomvang, de kansverdelingen nagenoeg aan elkaar gelijk zijn. Gevolg is dat je voor elk van de drie methodes op nagenoeg dezelfde steekproefomvang uitkomt. Echter, wanneer het verwachte aantal fouten groot is en de steekproefomvang klein, dan levert de Poisson-berekening een grotere hoeveelheid steken dan de andere twee. Je verkrijgt dan feitelijk te veel zekerheid ten opzichte van toepassing van de binomiale en hypergeometrische steekproefomvang. Meer zekerheid is echter geen probleem in de audit en dus kun je alle drie de methodes gebruiken. Nu we een goed beeld hebben van de verschillende berekeningen die er zijn zullen we in een volgende column in gaan op de vraag hoe je zelfstandig de juiste steekproefomvang kunt berekenen.

In de onderstaande tabel is dit samenvattend weergegeven en is de functie per verdeling weergegeven.

De steekproefomvang ontmaskerd - een introductie 900x590

Gerelateerd

8 reacties

Ron Heinen

@Hein Kloosterman: "De reactie van de zich 'accountant van de toekomst' noemende reacteur slaat helaas als een tang op een varken. Jammer."

Mee eens.

De 'Accountant van de toekomst' stelt: "Laten we data gaan screenen en analyseren op hoge risico’s. "

Als je bijvoorbeeld het boek "Audit Analytics: Data Science for the Accounting Profession" leest, dan zie je dat dit ook een toepassing van wiskunde is.

De audit kun je met Data Science inrichten zoals je wilt, bijvoorbeeld gericht op hoge risico's, zoals de 'Accountant van de toekomst' wil.

Ron Heinen

Het geven van duidelijke referenties in dit type artikelen kan de lezerz helpen om te begrijpen waar het om gaat, zie bijvoorbeeld

https://limperginstituut.nl/events-and-conferences-2019/essaybundel-statistical-auditing/

Alexander Vissers

Het verhaal van de auteur is te populair om waar te zijn en te technisch om begrijpelijk te zijn. Door het woord "toetsen" te vermijden blijft er een onsamenhangende beschouwing over. De auteur bedoelt kennelijk te beschrijven hoe groot de steekproefomvang dient te zijn bij het uitvoeren van het toetsen van een hypothese over de populatie waaruit de waarnemingen (aselect) worden geselecteerd. De omvang is verder afhankelijk van een veronderstelde verdeling van de waarden Gegeven de gewenste betrouwbaarheid van de uitkomst resulteert dan een steekproefomvang. Probleem is natuurlijk dat de toets maar een kant op werkt In de controle van de jaarrekening stuit deze wijze van toetsen veelal al op de moeilijkheid een geldige toetsbare en tevens nuttige hypothese te formuleren. Deze moet vooral gezocht worden in het toetsen van de werking van de interne controle en veel minder in de juistheid van posten. In dit verband is de opmerking van "accountant van de toekomst" goed te plaatsen, een intelligente analyse van data is voor het beoordelen van die data van veel groter praktisch nut dan steekrpeoven, statistisch of eenvoudig. Volgens mij worden de door de auteur aangehaalde voorbeelden (dollar value toets, foute euro's toets) nergens in de praktijk toegepast ook al niet omdat je met de conclusie uit de toets hypothese binnen onzekerheid bevestigd of verworpen ook niet veel verder komt.

Hein Kloosterman

Jammer. Mijn ervaring met het 'onder de mensen brengen' van steekproeven is dat formules die mensen kopschuw maken. Je hebt ze nodig. Maar onder de motorkap, zogezegd. De zogenoemde risicogerichte methoden zijn allemaal (of vrijwel allemaal) gemodelleerd met behulp van statistiek. Vaak zie je het niet meer. De reactie van de zich 'accountant van de toekomst' noemende reacteur slaat helaas als een tang op een varken. Jammer.
Misschien zou de auteur van deze column kunnen beginnen (opnieuw beginnen) met het uitleggen van posten- en geldsteekproeven. Eventueel met het waarderen van voorinformatie. Misschien met de bepaling van steekproefintervallen.

Jan Borger

Mooi gezegd @Alexander Vissers. Ik voel wel mee met @Accountant van de toekomst dat steekproeven nu niet direct de "fun" in het vak naar boven brengen.

Alexander Vissers

Accountant van de toekomst, volgens mij overtreedt u de regels dus graag reactie onder eigen naam. Steekproeven hebben een geringe betekenis voor de accountantscontrole maar bijvoorbeeld voor de beantwoording van een controlevraag vraag of een voorraadopname goed is uitgevoerd en er een redelijke mate van zekerheid bestaat over het bestaan van de voorraden kan een steekproef "evidence" waarde hebben. Of deze steekproef eenvoudig of statistisch moet zijn is aan discussie onderhevig. Er moet voor gewaakt worden de controle te vereenzelvigen met steekproeven maar dat is meer een gedachte die bij leken opkomt. De steekproef is slechts een van de gereedschappen uit de gereedschapskist van de accountant en kan op zichzelf noit de conclusie rechtvaardigen dat een verslaggeving aan de daaraan te stellen eisen voldoet. Veelal zal de voorgestelde gerichte analyse van data meer inzicht in de betrouwbaarheid van de cijfers opleveren dan willekeurige steekproeven.

Accountant van de toekomst

Steekproeven zijn de doodsteek voor het accountantsvak. Ik ben er daarom ook fel op tegen. Laten we data gaan screenen en analyseren op hoge risico’s. Alsjeblieft stop met het doelloos steekproeven van grote hoeveelheden routine matige data, wat alleen maar voor ergenis en onkunde zorgt in ons vakgebied.

Ron Heinen

Wiskunde, dus ook statistiek, is absolute kennis. Het zal voor altijd geldig blijven, ongeacht welke nieuwe ontwikkelingen er ook komen, ook in de accountancy.

Via de transitieve eigenschap van de map-of-science is wiskunde de basis voor alle wetenschappelijke disciplines.

Een uitleg van het bovenstaande is bijvoorbeeld te vinden op

https://www.math4sci.com/map-of-science/

Reageren op een artikel kan tot drie maanden na plaatsing. Reageren op dit artikel is daarom niet meer mogelijk.

Aanmelden nieuwsbrief

Ontvang elke werkdag (maandag t/m vrijdag) de laatste nieuwsberichten, opinies en artikelen in uw mailbox.

Bent u NBA-lid? Dan kunt u zich ook aanmelden via uw ledenprofiel op MijnNBA.nl.