Statistiek en (zelf-)destructie
Naast vaktechnische highlights, willen we in de columns af en toe wat afstand nemen en genieten van uitzicht op bijzondere trekken van het vak statistiek. Zo kun je statistiek zien als een middel tegen (zelf)destructie.
Ed Broeze
Een lamp testen op levensduur is nodig om de kwaliteit vast te stellen, maar pas als hij de geest geeft weet je wat je weten wilt. Dan heb je er echter niet veel meer aan. Operatie gelukt, maar patiënt overleden; een destructieparadox.
Hetzelfde geldt voor het testen van de smaak van een levens- of genotsmiddel: de test maakt verkoop van het geteste product onmogelijk. Opnieuw: operatie gelukt, maar patiënt opgegeten.
Is dan testen onmogelijk als het tot destructie van het geteste product leidt? Gelukkig valt dat mee, maar je moet dan wel bereid zijn een representativiteitsveronderstelling voor lief te nemen. Twee soorten veronderstellingen komen in beeld:
- een steekproef is representatief voor een verzameling producten (bijvoorbeeld lampen, flesjes sportdrank) waaruit hij is getrokken of
- een steekproef nú is representatief voor de producten die een proces in de toekomst zal voortbrengen.
Als je de producten in die steekproef test, blijft de letterlijke destructieparadox bestaan, maar toch kun je beslissen of een niet-geteste lamp lang genoeg zal branden. Die is als het ware plaatsvervangend getest. Dat kan heel precies als zou blijken dat al de geteste lampen even lang branden: dat wettigt de verwachting dat een niet geteste lamp ook zo lang zal branden (op basis van de representativiteitsveronderstelling).
Maar als er variatie optreedt in de kwaliteit per eenheid, zul je marges moeten inbouwen in je verwachte kwaliteit voor de niet-geteste lampen (op basis van dezelfde representativiteitsveronderstelling).
Hier komt de statistiek op een heel prettige manier om de hoek kijken: door de steekproef aselect te trekken, dat wil zeggen: zó dat iedere eenheid dezelfde kans op selectie heeft, biedt de statistiek in combinatie met de kansrekening de mogelijkheid betrouwbaarheid en precisie van een schatting (bijvoorbeeld van de verwachte levensduur) te berekenen. Zo leidt onvoorspelbaarheid per eenheid tot voorspelbaarheid voor een hele verzameling van eenheden. Een onvoorspelbaarheidsparadox omzeilt de destructieparadox.
Een accountant wordt bij detailcontroles van omvangrijke(re) verzamelingen transacties, zoals debiteuren, ook met een 'destructieparadox' bedreigd. Volledige controle van een debiteurenbestand geeft het juiste beeld (mits geen fouten in controle) maar de accountant heeft zich dan wel uit de markt geprijsd; (zelf)destructie door perfectionisme.
Maar voor dit probleem biedt ‘de steekproef' een analoge oplossing: een aselecte steekproef uit de debiteuren laat zich controleren, uit de gevonden fouten is een schatting van de fout in de hele populatie van debiteuren mogelijk, voorzien van precisie en betrouwbaarheid. En daarop kan een beslissing over de kwaliteit worden gebaseerd.
De voor de beslissing noodzakelijke analyses zijn gefundeerd in een zeer rijk bouwwerk van statistische en kanstheorie. Dat vaart wel bij de paradox dat onvoorspelbaarheid (per geval) nodig is voor voorspelbaarheid (binnen het geheel) - zoals recht wel vaart bij blindheid van Vrouwe Justitia.
Mogelijkheden om soms onverwachte verbanden te leggen, voorspellingen te doen, of dagelijkse handelwijzen te valideren komen daarmee binnen handbereik. Van destructie naar opbouw van kennis.
Gerelateerd
Machine learning in de audit: stratificeren van bedrijfslocaties
In dit derde en laatste deel van een reeks columns over machine learning in de audit gaat het over clusteren. De auteurs laten zien hoe je met een open-source statistiekprogramma...
Machine learning in de audit: uitschieters bij vastgoedwaardering
Regressie is een vorm van machine learning met als doel het voorspellen van cijfers op basis van een aantal kenmerken. Met open-sourcesoftware kun je zonder programmeerkennis...
Machine learning in de audit: voorspellen van klantverloop
Het doel van machine learning is om voorspellingen te maken aan de hand van data. Binnen dit veld worden doorgaans drie hoofdtoepassingen onderscheiden: classificatie,...
De steekproefomvang ontmaskerd - deel 5
In vorige columns hebben we verschillende manieren besproken om tot een steekproefomvang te kunnen komen. Deze column is de laatste van de serie waarin we verschillende...
De steekproefomvang ontmaskerd - deel 4
Een accountant die gebruikmaakt van software om een steekproefomvang te berekenen, moet zeker weten dat die software dat goed doet. Daarvoor moet je de rekenmethode...