Statistical auditing (48)

Representatief en realistisch - vervolg

Een list voor het schatten van een bedrag: helpt een pilot-onderzoek?

Paul van Batenburg

In een vorige column (nummer 46) heb ik laten zien hoe een steekproefomvang kan worden berekend als men een percentage wil schatten op basis van de vereiste betrouwbaarheid en onnauwkeurigheid. Zo bleek een steekproef van 68 voldoende om met 90 procent betrouwbaarheid en 10 procent onnauwkeurigheid een schatting te geven van het percentage winstgevende loodgietersbedrijven. Als er immers in die 68 waarnemingen precies 34 winstgevende bedrijven zijn, is de onnauwkeurigheid rondom de beste schatting van 50 procent bij 90 procent betrouwbaarheid 1,645 * √(50% * (100%-50%)) / √68=: afgerond 10 procent. Als het aantal winstgevende bedrijven in de steekproef niet 34 maar x% is, dan is de spreiding √(x%*(100%-x%)) altijd kleiner dan √(50% * (100%-50%)) en wordt het interval smaller en de schatting nog nauwkeuriger.

Om de steekproefomvang te bepalen hoeven we dus in bovenstaande casus de spreiding niet vooraf te kennen. Dat wordt anders als de onderzoeksvraag niet is gesteld in de vorm van het schatten van een percentage maar het schatten van een bedrag. Als we het gemiddelde winstbedrag van loodgietersbedrijven willen schatten met 90 procent betrouwbaarheid en 10 procent onnauwkeurigheid zullen we de spreiding – oftewel de maat daarvoor, de standaarddeviatie σ – moeten invullen in de formule voor de onnauwkeurigheid 1,645 σ/√n. Maar er is nóg een uitdaging: als die onnauwkeurigheid maximaal 10 procent van het geschatte gemiddelde mag zijn, wordt de noodzakelijke steekproefomvang groter naarmate de geschatte gemiddelde winst kleiner wordt!

Er moet dus een list worden verzonnen voor het invullen van de standaarddeviatie, van σ dus, bijvoorbeeld door gebruik te maken van de uitkomsten van een eerder onderzoek of van een pilotstudie. Daarbij is het heel belangrijk om de betrouwbaarheid en onnauwkeurigheid van die voorgaande schatting te weten. Immers, als de spreiding in de nieuwe steekproef groter blijkt dan die in dat vorige onderzoek, dan wordt de onnauwkeurigheid groter dan verwacht en blijkt de steekproefomvang achteraf dus te klein te zijn.

Er is dus een groot risico bij deze methode dat de spreiding in de te onderzoeken grootheid wordt onderschat, zodat de steekproef niet toereikend is om de onderzoeksvraag te beantwoorden. Daarom is het erg belangrijk dat zo’n pilotsteekproef groot genoeg is. Vaak zie je de suggestie om 20 tot 30 waarnemingen te doen.

Stel dat de populatie bestaat uit 95 procent correcte boekingen en 5 procent boekingen met fouten. We steken een pilot van 20 en bepalen de standaarddeviatie van de fouten. De kans op een foutloze steekproef, en dus een standaarddeviatie van 0 en een noodzakelijke controle van 20 waarnemingen is 0,95 tot de macht 20 oftewel 35 procent. Een op de drie pilots zal dus zeker de spreiding onderschatten (er zijn immers wel fouten, maar niet in de pilot) en op een te lage steekproefomvang uitkomen.

In de jaren tachtig van de vorige eeuw heeft professor J. Kriens van de toenmalige KUB (nu Tilburg University) een simulatiestudie gedaan op magazijnvoorraden. Uit bestanden met integraal getelde voorraden werden steekproeven getrokken en de spreiding in de afwijkingen werd vergeleken met de spreiding in de gehele populatie. Bij welke minimale omvang van een pilot weet je voldoende zeker dat de spreiding niet wordt onderschat? Het antwoord was niet fijn: 100 tot 200 waarnemingen, afhankelijk van het aantal fouten in de populatie. Een pilot met een omvang van 20 à 30 is dus te klein.

Wat ook verrassend was in het simulatieonderzoek: hoe slechter de populatie, des te minder waarnemingen er nodig zijn voor een oordeel. Niet intuïtief, en ook lijnrecht ingaand tegen het risicoanalysemodel. Maar dat was ook niet bedacht voor dit soort controles. Schatten is nu eenmaal efficiënter dan toetsen, maar leidt niet tot een beheersing van het risico op ten onrechte goedkeuren.

Drs. Paul van Batenburg is zelfstandig adviseur die als statisticus met verstand van controleren de eenmanszaak en website steekproeven.eu voert.

Gerelateerd

reacties

Reageren op een artikel kan tot drie maanden na plaatsing. Reageren op dit artikel is daarom niet meer mogelijk.

Aanmelden nieuwsbrief

Ontvang elke werkdag (maandag t/m vrijdag) de laatste nieuwsberichten, opinies en artikelen in uw mailbox.

Bent u NBA-lid? Dan kunt u zich ook aanmelden via uw ledenprofiel op MijnNBA.nl.