Statistical auditing (97)

De steekproefomvang ontmaskerd - deel 3

Steekproefomvangen berekenen doen we meestal met rekenbladen in Excel of statistische software. Hoewel velen van ons statistiek hebben gehad, is het berekenen van de steekproefomvang in de audit toch lastig. In deze column gaan we in op hoe je handmatig een steekproefomvang kunt berekenen.

Niels van Leeuwen

In vorige columns hebben we verschillende manieren besproken om tot een steekproefomvang te kunnen komen. We stelden vast dat wanneer we waarnemingen classificeren in goed of fout, we spreken over discrete data. De verdeling die het beste past bij zulke data is de hypergeometrische. We hebben ook gezien dat de binomiale en Poisson-verdeling het rekenen vereenvoudigen. We hebben drie manieren besproken om tot een steekproefomvang te kunnen komen, namelijk het benaderen in Excel, werken met np-tabellen en gebruikmaken van de inverse gammafunctie in Excel. De inverse gammafunctie is een alternatief voor de inverse Poisson-verdeling.

In deze column wordt duidelijk gemaakt waarom het terecht is dat je deze formule kunt gebruiken. De inverse Poisson-verdeling komt namelijk tot stand door de Poisson-formule zo in te richten dat de uitkomst van de formule de np-waarde is, in plaats van de betrouwbaarheid. Dit herinrichten gebeurd op vergelijkbare wijze als bij 12 = 3 x 4, wat gelijk is aan 3 = 12 / 4. Als we in de bestaande Poisson-formule alle parameters invullen behalve de np-waarde, dan kunnen we deze gesloten formule oplossen. Net zoals wanneer we de waarde van x kunnen vinden in de formule 3 = 12 / x. Dit kan handmatig wanneer het verwachte aantal fouten 0 is. Dit kan ook met de binomiale formule.

Laten we beginnen met het ophalen van de parameters uit de vorige columns. We werkten met een populatieomvang N = € 1mln. We hebben een materialiteit van p = 5 procent wat neer komt op € 50.000. We willen 95 procent betrouwbaarheid behalen, dus 1 - β = 95 procent. Omdat er alleen een gesloten formule bestaat voor nul fouten, houden we het verwachte foutpercentage op 0 procent, dat betekent dat het aantal verwachte fouten in de steekproef gelijk is aan k = 0. Dit kunnen we samenvatten in de volgende parameters:

  • 1-β = 95 procent
  • n = 1.000.000
  • p = 5 procent
  • k = 0

We beginnen met de binomiale verdeling. Hoewel in Excel de inverse functie van de binomiale verdeling niet leidt tot een steekproefomvang, kun je wel handmatig de steekproefomvang berekenen met de binomiale formule. In onderstaande tabel staat stapsgewijs toegelicht hoe dit werkt. 

Statistical Auditing 97 schema 1 nieuw

Uitkomst.png

De vorige berekening zag toe op de binomiale formule. Laten we nu hetzelfde doen voor de Poissonformule.

Statistical Auditing 97 schema 2 nieuw

De minimale steekproefomvang is dus 60 voor deze parameters. Dit sluit aan met de uitkomst van de manieren uit de vorige column. Als het aantal verwachte fouten in de steekproef (k) toeneemt wordt dit echter lastiger omdat de oplossing van k! niet uitkomt op 1 en je daardoor een benadering moet doen die omslachtig is. Het is dan efficiënter om de inverse gammafunctie in Excel te gebruiken.

Als je teruggaat naar oudere columns dan zie je dus dat de steekproefomvang inderdaad overeenkomt met de berekening via eerdere manieren die we hebben gehanteerd. Deze column laat zien hoe van de binomiale en Poissonformule uitgekomen kan worden op de steekproefomvang. De inverse verdeling van beide formules is feitelijk dezelfde formule met als uitkomst de steekproefomvang of np-waarde. We hebben in de vorige column al aangegeven dat Excel een inverse gamma verdeling kent, die gelijk is aan de inverse Poissonverdeling. Met de handmatige berekeningen in deze column zien we dat de steekproefomvang berekend kan worden, met dezelfde uitkomst als wanneer de inverse gammaverdeling wordt gebruikt.

Voor de binomiale verdeling hebben we gezien dat de handmatige berekening aansluit met de benaderingsmethode uit de vorige column. Je weet nu dan ook waarom het terecht is dat je de inverse gamma verdeling kunt gebruiken. Hierdoor kun je goed onderbouwd gebruik maken van deze functie in Excel. In de volgende column zullen we kijken hoe een algoritme de benaderingsmanier automatiseert. In de opvolgende column gaan we kijken hoe je gebruik kunt maken van de gratis en open-source software JASP om de steekproefomvang te berekenen voor elk aantal verwachte fouten.

Referenties

Eerdere columns

Gerelateerd

reacties

Reageren op een artikel kan tot drie maanden na plaatsing. Reageren op dit artikel is daarom niet meer mogelijk.

Aanmelden nieuwsbrief

Ontvang elke werkdag (maandag t/m vrijdag) de laatste nieuwsberichten, opinies en artikelen in uw mailbox.

Bent u NBA-lid? Dan kunt u zich ook aanmelden via uw ledenprofiel op MijnNBA.nl.