Statistical auditing (46)

Representatief en realistisch

Onlangs stelde een ministerie in een offerteverzoek dat een voor het onderzoek te trekken steekproef "representatief en realistisch" moest zijn. Als statisticus vraag je je dan af hoeveel waarnemingen daarvoor nodig zijn.

Paul van Batenburg

Bij een realistische steekproef kan ik mij niets voorstellen, maar representativiteit is te concretiseren. Die eis betekent dat relevante kenmerken in een populatie naar evenredigheid in een steekproef moeten voorkomen. Maar zo'n eis zegt nog niets over de omvang van die steekproef.

Stel, 10 procent van de elementen van een populatie heeft een relevant kenmerk wel en de andere 90 procent heeft dat niet. Ongeacht de omvang van de steekproef zal het percentage in de steekproef met dat kenmerk gemiddeld over alle mogelijk te trekken steekproeven weer 10 procent zijn. Alleen, hoe groter de steekproef is, des te zekerder (betrouwbaarheid) we weten dat die uitkomst ook dicht in de buurt (onnauwkeurigheid) van 10 procent ligt. Een steekproef van 10 elementen uit deze populatie heeft ruim 1/3 kans om ook een 10/90 verhouding te leveren. Representatiever kan niet! Maar de kans op 10 gelijke waarnemingen is ook ruim 1/3 en zo’n steekproef zal 'helemaal niet' representatief zijn.

Als we de populatie eerst naar dat kenmerk in twee deelpopulaties kunnen opdelen en dan twee deelsteekproeven trekken, weten we zeker dat de steekproef representatief is wat betreft dit kenmerk. En nu maar hopen dat het kenmerk zo relevant is dat al dat werk de moeite waard is: als achteraf blijkt dat het kenmerk helemaal niet zo belangrijk is, hebben we voor niets gestratificeerd. Ook dan is de omvang van de steekproef dus niet relevant.

Als we dus weten dat een populatie een bepaalde verdeling voor een relevant kenmerk heeft, kunnen we door stratificatie representativiteit afdwingen. Het wordt anders als we vermoeden dat de populatie een bepaalde verdeling van dat kenmerk heeft, omdat die uitkomst nog niet in de dataset bevat is en in de steekproef moet worden verzameld. De opdrachtgever zal dan bij het stellen van eisen voor representativiteit moeten aangeven om welke kenmerken het gaat, wat het vermoedelijke voorkomen daarvan is en met welke onnauwkeurigheid en betrouwbaarheid die kenmerken in de steekproef vertegenwoordigd moeten zijn.

De termen onnauwkeurigheid en betrouwbaarheid blijven voor niet-statistici lastig, en daarom dus ook voor wel-statistici. Want hoe weet je als opdrachtnemer dat de opdrachtgever het snapt? Als voorbeeld een geanonimiseerd citaat uit een offerteverzoek:

"De steekproef dient een uitspraak te geven over XXX  in de totale populatie met een betrouwbaarheid van 90 procent en een nauwkeurigheid van 10 procent. In [onderdelen van de populatie] wordt 85 procent betrouwbaarheid en 15 procent nauwkeurigheid verlangd."

Als statisticus vrees je dat de opdrachtgever de klok heeft horen luiden, maar niet weet waar de klepel hangt. Het gaat immers niet om een nauwkeurigheid van 10 procent maar om de ónnauwkeurigheid, en er bestaat geen wet die zegt dat de percentages van onnauwkeurigheid en betrouwbaarheid tot 100 optellen. Bovendien is een dergelijke specificatie van eisen misschien wel bruikbaar bij telbare kenmerken (die een percentage “ja” en een percentage “nee” bezitten), maar niet bij meetbare kenmerken.

Als het onderzoek over de winstgevendheid van loodgietersbedrijven gaat, kan je met dergelijke eisen uit de voeten bij een (telbare) opdeling 'wel of niet winst', maar niet als het om het (meetbare) winstbedrag gaat. Want hoe passen we dat percentage toe op dat bedrag? Het toepassen van deze criteria op de gemiddelde winst wordt een probleem als die winst gemiddeld nul of negatief blijkt te zijn.

Belangrijkste reden waarom dergelijke eisen van representativiteit vaak niet uitvoerbaar zijn, is dat die worden verwoord in termen van de te verklaren variabele van het onderzoek. Als een onderzoek is gericht op het in beeld brengen van de gemiddelde winst van loodgietersbedrijven en de steekproef wordt geacht dat gemiddelde met een bepaalde onnauwkeurigheid bij een gekozen betrouwbaarheid in kaart brengen, is er geen zinnig mens die een steekproefomvang uit de hoed kan toveren. Immers, die omvang hangt af van de uitkomsten. En de uitkomsten weet je pas lang nadat de omvang is bepaald.

Zonder formules te geven, zal het duidelijk zijn dat een steekproef groter moet zijn wanneer:

  • de uitspraak nauwkeuriger moet zijn, dus het verschil tussen de onbekende werkelijke waarde en de uitkomst kleiner moet zijn;
  • de uitspraak betrouwbaarder moet zijn, dus de kans dat de werkelijke waarde binnen die onnauwkeurigheidsmarge valt, groter moet zijn;
  • de spreiding in de populatie groter is (maar die spreiding is pas achteraf bekend), omdat het dan moeilijker is om een representatief beeld van de populatie te geven.

Bij telbare kenmerken zegt een vuistregel dat spreiding in het gevonden percentage maximaal is bij een percentage van 50. Op die manier kan bij dit soort onderzoeken de onbekendheid van de spreiding in de populatie worden omzeild, maar bij meetbare kenmerken is dat gegeven echt onontbeerlijk.

Als dus de opdrachtgever een uitspraak wil over het percentage winstgevende loodgietersbedrijven met een onnauwkeurigheid van 10 procent bij een betrouwbaarheid van 90 procent, dan is er een steekproefomvang te bepalen. De onnauwkeurigheid is dan immers z * s / √n waarin:

z= de tabelwaarde uit de normale verdeling bij 90 procent betrouwbaarheid: 1,645;
s = de spreiding van het percentage in de steekproef, waarvan we weten dat die nooit groter kan zijn dan √(0,5x0,5)= 0,5;
n = de steekproefomvang, die in dit geval minimaal 1,6452. 0,52/0,12 = 68 moet zijn.

We gaan er hier van uit dat de onnauwkeurigheid eenzijdig is gevraagd, dus dat de toegestane marge rondom de schatting zowel 10 procent naar boven als 10 procent naar beneden mag afwijken.

Als we de winst van die bedrijven willen meten, kunnen we s niet invullen. Een pilotstudie, een eerste steekproef om te bepalen hoe groot de echte steekproef moet zijn, is dan misschien een oplossing. Daarover een volgende keer.

Drs. Paul van Batenburg is zelfstandig adviseur die als statisticus met verstand van controleren de eenmanszaak en website steekproeven.eu voert.

Gerelateerd

9 reacties

Hein Kloosterman

Veel van onze columns gaan over geldsteekproeven. De methodologie met betrekking tot die steekproeven is niet echt complex. De toepassingen vereisen vooral de beschikbaarheid van de bestanden met de gegevens van de transacties van de gecontroleerde.
Het trekken van een geldsteekproef is eerlijk gezegd een kunstje. Het controleren van de vastleggingen van transacties gaat net als bij een integrale controle, alleen minder vaak. Wat is er nu ingewikkeld? Zijn de beoordelingsnormen complex? No problem. Althans geen steekproefprobleem. Zijn de uitvoeringsnormen complex? Kan ik mij niet voorstellen. Ik heb zo vaak steekproeven uitgevoerd; probleem is hooguit de gecontroleerde overtuigen dat iets niet 'goed' gevonden kan worden.
Welke controlemethode of -techniek je ook toepast: je moet voor voldoende evidence zorgen om goed te kunnen keuren. What 's the problem?

Hans Kuipers

@Paul

Mijn reactie is niet alleen bedoeld voor dit specifiek geval. Het bevat de algehele controletechniek en hoe dit in de praktijk wordt toegepast.
Laten we wel realistisch zijn. Het opnemen van de randvoorwaarden voor een steekproef in een offerte is niet gebruikelijk.
Gezien dit niet gebruikelijk is was het mijn bedoeling om mijn reactie breder te formuleren zodat we accountancy breed er ons voordeel uit kunnen halen.

Gezien ik dagelijks te maken met het toepassen van de steekproef in mijn werkzaamheden heeft deze problematiek wel mijn volle interesse.

Hoop dat in de toekomst artikelen die specifieke controletechnieken bevatten aangevuld worden met praktijkvoorbeelden zodat de implementatie hiervan in mijn dagelijkse werkzaamheden een positieve invloed hebben.
Ik zie je toekomstige columns met vertrouwen tegemoet.

Paul van Batenburg

Hans, je zegt in je eerste reactie dat je het onderwerp van mijn column achterhaald vindt. Als een opdrachtgever dit in een offerteverzoek vraagt is het per definitie niet achterhaald. Nu ik je vraag om een reactie te geven die ingaat op de inhoud van mijn bijdrage kom je met de dooddoeners van niet praktisch en niet toepasbaar. Maar, wederom, wat is er praktischer en toepasbaarder dan een klant die deze vraag stelt? Als je het niet interessant vindt, ga dan wat anders lezen, maar schiet niet uit de heup enkel om te schieten. Deze site staat vol van discussie over het al dan niet achterhaald zijn van steekproeven maar deze column gaat over een klant die om een steekproef vraagt. Moet ik dan zeggen dat hij achterhaald is? Dan krijg ik de opdracht zeker niet.

Hans Kuipers

@Paul
Mijn reactie heeft te maken met de complexiteit en toepasbaarheid in de praktijk van de beschreven methode.

Wanneer we echt een slag willen maken dat de beschreven methodes in de praktijk worden toegepast, dienen we naast de theoretisch/wetenschappelijke benadering een koppeling te maken met de praktijk.
Ik mis bij de meeste wetenschappelijke artikelen een aantal praktijk cases. Hierdoor is het dan voor iedereen herkenbaar en toepasbaar waardoor het artikel zijn eigenlijke doel bereikt.

Dat is toch wat we willen bereiken met deze artikelen?

Voor de praktijkgerichte accountant die het herkenbaar en toepasbaar worden.

Wanneer ik deze artikelen tot me neem dan wil ik het ook graag in de praktijk toepassen en niet dat het alleen bij lezen blijft.

Paul van Batenburg

Beste Hans:
In hoeverre is jouw post een inhoudelijke reactie op mijn column die gaat over wat representativiteit betekent? Als je een mening hebt wordt die mening wel zo interessant als die aansluit bij het onderwerp van de column. Vind ik. Met een d.

Hein Kloosterman

@Hans
Je noemt een bijzonder voorbeeld: een steekproef die als doel heeft een lijncontrole uitgevoerd te krijgen.
Afgezien van de omvang bij zo'n posten-steekproef, hij is niet gegevensgericht maar organisatiegericht. De vraag is dus: heeft de organisatie rondom de salaristoekenning en -betaling gewerkt (althans: zijn de weerslagen van de maatregelen weergegeven zoals verwacht mocht worden).
Bij zo'n kleine steekproef verwacht je dat een fout je direct zal opbreken. Het lijkt mij toe dat nader onderzoek geboden is.
Als de lijncontrole was bedoeld om een reductie van de gegevensgerichte controles toe te kunnen staan, dan lukt dat (waarschijnlijk) nu niet.
Het is altijd de moeite waard om te kijken of een uitgebreid niveau van gegevensgerichte controle eventuele fouten ten aanzien van de salarissen een glimp van de foutoorzaken zal laten zien. Kost wel tijd.
Maar ja. Dat zal toch moeten wil de rug recht blijven.

Hans Kuipers

@Hein

Ik ben het wel eens met je motivatie maar de uitvoering in de praktijk laat soms te wensen over.
Een praktijkvoorbeeld.
De lijncontrole lonen en salarissen. We dienen 30 dossier op te nemen in de steekproef. In 28 gevallen is er niets bijzonders en in twee gevallen kom je iets tegen wat verder uitgezocht dient te worden. Ik kan me dan voorstellen dat een assistent of stagiaire dan kan denken om twee andere dossiers in steekproef op te nemen die wel voldoen waardoor er veel minder werkzaamheden hoeven plaats te vinden. De werkzaamheden tijdens een lijncontrole zijn niet de leukste werkzaamheden.
Vaak dien je meerdere afdelingen binnen een organisatie erbij te betrekken waardoor er wel eens het gevoel kan ontstaan om de lijncontrole zo snel mogelijk af te ronden.

Hein Kloosterman

Elke audit appraoch kent op de een of andere manier een term als materialiteit (al was het maar omdat die in de internationale richtlijnen staat).
Elke audit approach kent een begrip als risico, bijvoorbeeld auditrisico, controlerisico.
Elke audit approach kent een methodiek die de verkregen ‘evidence’ aggregeert.
Zowel materialiteit als risicoanalyse in de controle als het aggregeren van ‘evidence’ vinden hun oorsprong in statistiek en steekproeven.
Het onderzoek ernaar en de praktijk ervan zijn heel aardig terug te lezen in “Bell, T.B. en A.M. Wright (eds), (1995), Auditing, Practice, Research and Education, American Institute of Certified Public Accountants, New York”.

Misschien dat Hans Kuipers dergelijke literatuur niet leuk vindt. Dat betekent nog niet dat het allemaal onzin is wat er over steekproeven in geschreven. En waar zijn de wetenschappelijke artikelen die samen met de stand van de digitalisering, steekproeven als achterhaald classificeren? Noem een voorbeeld, Kuipers!

Als steekproeven niets aan de controle toevoegen, bedoelt Kuipers daarmee te zeggen dat ze geen fouten tonen? Als dat zo is, dan is de toegevoegde waarde groot, de controle wordt erdoor in de richting van goedkeuring gestuwd. Als dat niet zo is, er komen dus fouten voor in de steekproef, dan moet er verbeterd worden (door de klant). Ook dat is een grote toegevoegde waarde.

Ik ga niet in op het ongefundeerde argument over stagiaire of assistent pesten.

Hans Kuipers

Gezien de huidige stand van de digitalisering en de wetenschappelijke artikelen die over de "steekproef' zijn verschenen vindt ik eerlijk gezegd deze methodiek achterhaald.
We moeten ons meer gaan focussen om deze werkzaamheden geheel te digitaliseren en een geheel andere interpretatie geven aan de steekproef. Zelf voer ik het ook op deze manier uit maar ik heb er steeds meer moeite mee gezien dit echt werkzaamheden betreffen die in het verre verleden thuis horen.
Verder vindt ik de uitkomst van de steekproeven weinig tot niets toevoegen aan de controle van de jaarrekening. Soms heb ik het gevoel dat we de steekproeven uitvoeren om onze stagiaires en assistent accountants bezig te houden en te treiteren.

Reageren op een artikel kan tot drie maanden na plaatsing. Reageren op dit artikel is daarom niet meer mogelijk.

Aanmelden nieuwsbrief

Ontvang elke werkdag (maandag t/m vrijdag) de laatste nieuwsberichten, opinies en artikelen in uw mailbox.

Bent u NBA-lid? Dan kunt u zich ook aanmelden via uw ledenprofiel op MijnNBA.nl.