Statistical Auditing (33) 19 augustus 2014

Oppassen met 'blokselectie'

Leestijd van ongeveer 4 minuten 0 reacties

Een onderneming wil een schatting maken van de aard van de binnengekomen orders van de laatste vijf jaar. Men heeft niet meer de beschikking over het bestand met orders over deze periode.

Hein Kloosterman

Door allerlei veranderingen is er nog een oud bestand met orderregels over de laatste vier jaar en drie maanden. Wel zijn er de nieuwe orderregels in het huidige systeem. De onderneming heeft heel veel kleine orders met elk een omvangrijke hoeveelheid orderregels. De hoeveelheid regels per order is daardoor vaak heel groot, soms matig groot en heel soms bevat een order maar één orderregel.

Die heel grote hoeveelheid schrikt de onderzoeker af. Ook ziet hij op tegen het werken met die oude bestanden. Hij besluit om de orderregels van twee aaneengesloten recente maanden (mei en juni) te onderzoeken. Omdat hij het gevoel heeft dat de orderregels hem om de oren vliegen, besluit hij tot het samenvoegen van de regels tot complete orders. Daarna laat hij een aselecte steekproef trekken uit die orders. De onderzoeker wil onderzoeken met een hoge statistische betrouwbaarheid en een hoge nauwkeurigheid. Daarom ontwerpt hij een steekproef van grote omvang.

De vraag is of dit een goede manier van werken is: krijgt de onderzoeker op deze manier wel een goed beeld van de aard van de binnengekomen orders over de laatste vijf jaar?

Twee delen

De trekking van de steekproef is in twee delen gebeurd. Het eerste deel is de selectie van de onderzoeken periode; deze is in het controlejargon het best te omschrijven als een blokselectie. Het tweede deel is als een mathematische steekproef te beschouwen.

Om een indruk te krijgen of er sprake is van een goede manier van werken, raadplegen we zowel de NV COS en als de theorie omtrent steekproeven.

NV COS laat in richtlijn 530 de term 'blokselectie' zien. Wat zegt deze richtlijn? In bijlage 4 van richtlijn 530 staat:

'Blokselectie omvat het selecteren van een of meer blokken van opeenvolgende eenheden binnen de populatie. Blokselectie kan in het algemeen niet worden gebruikt voor steekproeven bij een controle, omdat de meeste populaties zodanig zijn opgebouwd, dat de eenheden binnen een reeks naar verwachting dezelfde kenmerken zullen vertonen ten opzichte van elkaar, maar dat deze zullen verschillen ten opzichte van de kenmerken van andere eenheden in de populatie. Hoewel het onder bepaalde omstandigheden één van de geschikte controlewerkzaamheden kan zijn om een blok van eenheden te onderzoeken, is het zelden een geschikte techniek voor het selecteren van een steekproef wanneer de accountant op basis van steekproeven geldige conclusies wil trekken aangaande de populatie als geheel.'

De richtlijn zegt dus dat de accountant niet zonder meer een blokselectie kan toepassen als een oordeel over het totaal aantal blokken in de populatie nodig is. Beetje wollig is de tekst wel.

Clustersteekproef

Wat laat de theorie van de statistiek ons zien?

Het theoretisch fenomeen dat het dichtst bij blokselectie komt is de 'clustersteekproef'. Bij clustersteekproeven wordt eerst een groep waarnemingen aselect gekozen en vervolgens trekt men binnen elke groep een aantal elementen aselect. Er is dus sprake van twee keer een random trekking. Is dat niet het geval, dan is er misschien een uitspraak over dat ene blok mogelijk, maar niet over de verzameling blokken.

Het aselecte trekken van de blokken moet ervoor zorgen dat de blokken representatief zijn voor de populatie als geheel. Op dezelfde manier moeten de getrokken posten (records) binnen de getrokken blokken representatief zijn voor de posten in de populatie.

Doordat er een tweetrapsraket wordt gebruikt is de onnauwkeurigheid van een steekproef afhankelijk van zowel de clusterselectie (het aantal getrokken clusters) als van de selectie binnen een cluster (de uiteindelijk getrokken orders).

Wat gebeurt er als, zoals in het voorbeeld, maar één blok wordt geselecteerd en de onderzoeker over de hele populatie wil oordelen?

De formules - ik zal ze hier niet weergeven - laten zien dat de onnauwkeurigheid wordt berekend door onder meer te delen door het aantal clusters minus één. Men zou moeten delen door nul, dus. Maar daardoor wordt de berekende onnauwkeurigheid onbepaald groot.

Geen zinnig woord

Conclusie: de voorzichtigheid die richtlijn 530 uitspreekt voor een blokselectie, blijkt overduidelijk als die blokselectie leidt tot de selectie van één aaneengesloten deelperiode. In het voorbeeld is met de intensieve beoordeling van die ene deelperiode dus geen zinnig woord te zeggen over de aard van de orders over die totale periode van vijf jaar.

Stuurgroep Statistical Auditing

De Stuurgroep Statistical Auditing is verbonden met het Limperg Instituut en heeft als doel 'het bevorderen van het correcte (effectief en efficiënt) gebruik van statistische methoden en technieken bij accountantscontroles en daarmee verwante controles op financiële verantwoordingen en overzichten'.

Reageer

Hein Kloosterman RE RA, gepensioneerd adviseur IT-audit en Statistical Audit. Lid van de Stuurgroep Statistical Auditing.

Gerelateerd

Statistical auditing 10 december 2025

Auditen van de eerlijkheid van een algoritme, met behulp van statistiek

Eind 2024 trad de EU-wetgeving op kunstmatige intelligentie (AI) in werking. Deze wetgeving is opgesteld om het toenemende gebruik van AI in besluitvormings- en...

Statistical auditing 05 september 2025

De Wet van Benford

De Wet van Benford kent toepassingen binnen de audit en is opgenomen in veel auditsoftwarepakketten. Een verkenning van mogelijkheden, beperkingen en toetsing met...

Nieuws 24 april 2025

Symposium over statistiek in ESG

Hoe ver is de auditpraktijk met het toepassen van data-analyse op het gebied van ESG? De Stuurgroep Statistical Auditing van het Limperg Instituut gaat daarop in,...

Statistical Auditing (103) 22 november 2024

Machine learning in de audit: stratificeren van bedrijfslocaties

In dit derde en laatste deel van een reeks columns over machine learning in de audit gaat het over clusteren. De auteurs laten zien hoe je met een open-source statistiekprogramma...

Statistical auditing (102) 21 juni 2024

Machine learning in de audit: uitschieters bij vastgoedwaardering

Regressie is een vorm van machine learning met als doel het voorspellen van cijfers op basis van een aantal kenmerken. Met open-sourcesoftware kun je zonder programmeerkennis...