De steekproefomvang ontmaskerd - deel 3
Steekproefomvangen berekenen doen we meestal met rekenbladen in Excel of statistische software. Hoewel velen van ons statistiek hebben gehad, is het berekenen van de steekproefomvang in de audit toch lastig. In deze column gaan we in op hoe je handmatig een steekproefomvang kunt berekenen.
Niels van Leeuwen
In vorige columns hebben we verschillende manieren besproken om tot een steekproefomvang te kunnen komen. We stelden vast dat wanneer we waarnemingen classificeren in goed of fout, we spreken over discrete data. De verdeling die het beste past bij zulke data is de hypergeometrische. We hebben ook gezien dat de binomiale en Poisson-verdeling het rekenen vereenvoudigen. We hebben drie manieren besproken om tot een steekproefomvang te kunnen komen, namelijk het benaderen in Excel, werken met np-tabellen en gebruikmaken van de inverse gammafunctie in Excel. De inverse gammafunctie is een alternatief voor de inverse Poisson-verdeling.
In deze column wordt duidelijk gemaakt waarom het terecht is dat je deze formule kunt gebruiken. De inverse Poisson-verdeling komt namelijk tot stand door de Poisson-formule zo in te richten dat de uitkomst van de formule de np-waarde is, in plaats van de betrouwbaarheid. Dit herinrichten gebeurd op vergelijkbare wijze als bij 12 = 3 x 4, wat gelijk is aan 3 = 12 / 4. Als we in de bestaande Poisson-formule alle parameters invullen behalve de np-waarde, dan kunnen we deze gesloten formule oplossen. Net zoals wanneer we de waarde van x kunnen vinden in de formule 3 = 12 / x. Dit kan handmatig wanneer het verwachte aantal fouten 0 is. Dit kan ook met de binomiale formule.
Laten we beginnen met het ophalen van de parameters uit de vorige columns. We werkten met een populatieomvang N = € 1mln. We hebben een materialiteit van p = 5 procent wat neer komt op € 50.000. We willen 95 procent betrouwbaarheid behalen, dus 1 - β = 95 procent. Omdat er alleen een gesloten formule bestaat voor nul fouten, houden we het verwachte foutpercentage op 0 procent, dat betekent dat het aantal verwachte fouten in de steekproef gelijk is aan k = 0. Dit kunnen we samenvatten in de volgende parameters:
- 1-β = 95 procent
- n = 1.000.000
- p = 5 procent
- k = 0
We beginnen met de binomiale verdeling. Hoewel in Excel de inverse functie van de binomiale verdeling niet leidt tot een steekproefomvang, kun je wel handmatig de steekproefomvang berekenen met de binomiale formule. In onderstaande tabel staat stapsgewijs toegelicht hoe dit werkt.
De vorige berekening zag toe op de binomiale formule. Laten we nu hetzelfde doen voor de Poissonformule.
De minimale steekproefomvang is dus 60 voor deze parameters. Dit sluit aan met de uitkomst van de manieren uit de vorige column. Als het aantal verwachte fouten in de steekproef (k) toeneemt wordt dit echter lastiger omdat de oplossing van k! niet uitkomt op 1 en je daardoor een benadering moet doen die omslachtig is. Het is dan efficiënter om de inverse gammafunctie in Excel te gebruiken.
Als je teruggaat naar oudere columns dan zie je dus dat de steekproefomvang inderdaad overeenkomt met de berekening via eerdere manieren die we hebben gehanteerd. Deze column laat zien hoe van de binomiale en Poissonformule uitgekomen kan worden op de steekproefomvang. De inverse verdeling van beide formules is feitelijk dezelfde formule met als uitkomst de steekproefomvang of np-waarde. We hebben in de vorige column al aangegeven dat Excel een inverse gamma verdeling kent, die gelijk is aan de inverse Poissonverdeling. Met de handmatige berekeningen in deze column zien we dat de steekproefomvang berekend kan worden, met dezelfde uitkomst als wanneer de inverse gammaverdeling wordt gebruikt.
Voor de binomiale verdeling hebben we gezien dat de handmatige berekening aansluit met de benaderingsmethode uit de vorige column. Je weet nu dan ook waarom het terecht is dat je de inverse gamma verdeling kunt gebruiken. Hierdoor kun je goed onderbouwd gebruik maken van deze functie in Excel. In de volgende column zullen we kijken hoe een algoritme de benaderingsmanier automatiseert. In de opvolgende column gaan we kijken hoe je gebruik kunt maken van de gratis en open-source software JASP om de steekproefomvang te berekenen voor elk aantal verwachte fouten.
Referenties
- Inverse Poisson: https://www.youtube.com/watch?v=XsAuYYo0QE8
- Inverse binomial: https://www.youtube.com/watch?v=-d2lxxCbrHU
Eerdere columns
Gerelateerd
Machine learning in de audit: stratificeren van bedrijfslocaties
In dit derde en laatste deel van een reeks columns over machine learning in de audit gaat het over clusteren. De auteurs laten zien hoe je met een open-source statistiekprogramma...
Machine learning in de audit: uitschieters bij vastgoedwaardering
Regressie is een vorm van machine learning met als doel het voorspellen van cijfers op basis van een aantal kenmerken. Met open-sourcesoftware kun je zonder programmeerkennis...
Machine learning in de audit: voorspellen van klantverloop
Het doel van machine learning is om voorspellingen te maken aan de hand van data. Binnen dit veld worden doorgaans drie hoofdtoepassingen onderscheiden: classificatie,...
De steekproefomvang ontmaskerd - deel 5
In vorige columns hebben we verschillende manieren besproken om tot een steekproefomvang te kunnen komen. Deze column is de laatste van de serie waarin we verschillende...
De steekproefomvang ontmaskerd - deel 4
Een accountant die gebruikmaakt van software om een steekproefomvang te berekenen, moet zeker weten dat die software dat goed doet. Daarvoor moet je de rekenmethode...