Hoe krijg je zicht op een virus?
In maart 2020 ging Nederland op slot. In die tijd wisten we nog vrijwel niks over het coronavirus en al helemaal niet over de verspreiding ervan. De overheid kon in het begin alleen maar kijken naar het aantal positieve tests in Nederland. Maar dat getal geeft natuurlijk niet precies aan hoeveel mensen in Nederland daadwerkelijk corona hebben gehad. Veel mensen hadden geen ernstige klachten en lieten zich (met name in het begin) niet testen. Onderzoekers van het RIVM (Rijksinstituut voor Volksgezondheid en Milieu) hadden daarom iets anders bedacht. Door middel van bloedafname kon er worden onderzocht of er antistoffen tegen het virus aanwezig waren in het bloed. De aanwezigheid van antistoffen geeft namelijk aan dat je al in aanraking met het virus bent geweest. Ook als je geen klachten had.
Waarom een steekproef?
In de ideale situatie zou het bloed van elke inwoner in Nederland worden onderzocht. De overheid kan dan zeker weten wie wel en wie geen corona heeft gehad. Het is alleen niet haalbaar om van 17 miljoen mensen bloed af te nemen. Er wordt daarom een kleinere groep Nederlanders geselecteerd uit de hele bevolking. Deze kleinere groep heet “de steekproef”. De totale groep wordt “de populatie” genoemd.
Wat was de steekproefproportie van het RIVM?
De eerste ronde van het RIVM was in april 2020. De steekproef bestond uit 3207 Nederlanders en al deze deelnemers zijn getest op antistoffen. Van de 3207 deelnemers hadden 90 personen antistoffen in hun bloed, wat neerkomt op afgerond 3%. Dat komt overeen met een steekproefproportie van afgerond 0,03.
Hoe interpreteer je een steekproefproportie?
“3% van alle Nederlanders heeft tot nu toe corona gehad.”
Is dit een juiste conclusie? Je hebt namelijk maar een relatief klein groepje Nederlanders onderzocht in plaats van de hele bevolking. Toch worden dit soort conclusies vaak getrokken. Het is dan wel heel belangrijk dat de steekproef “representatief” is. Dat betekent dat de steekproef aan twee voorwaarden moet voldoen:
De steekproefomvang moet voldoende groot zijn.
De steekproef is aselect.
De eerste voorwaarde is vrij logisch. Als je maar tien Nederlanders in je steekproef betrekt, dan heb je te weinig informatie over de gehele Nederlandse bevolking. De tweede voorwaarde is iets ingewikkelder. Aselect betekent dat iedereen uit de populatie dezelfde kans moet hebben om in de steekproef terecht te komen. Als bijvoorbeeld 1000 van de 3207 deelnemers afkomstig zijn uit verzorgingstehuizen, dan is de steekproef niet aselect. De helft van de steekproef bestaat nu uit mensen uit een verzorgingshuis en dat klopt niet met de realiteit: de helft van de Nederlandse bevolking zit (gelukkig) niet in een verzorgingstehuis.
Om de steekproef representatief te maken heeft het RIVM een grote groep van 3207 bloeddonaties onderzocht en hebben ze kandidaten uit verschillende leeftijdsgroepen gekozen: de leeftijden variëren tussen de 2 en 90 jaar.
Wat weet de overheid nu?
Omdat de steekproef van het RIVM representatief was, kon de steekproefproportie van 3% gebruikt worden als een goede indicatie voor het aantal mensen dat in Nederland antistoffen tegen corona heeft opgebouwd. Het RIVM heeft vervolgens hetzelfde onderzoek nog vijf keer na april 2020 herhaald. In het najaar van 2021 was de steekproefproportie ongeveer 87% en dat geeft aan dat bijna iedereen in Nederland wel een keer in aanraking is geweest met corona.
Met deze informatie kon de overheid zicht houden op het virus. De steekproefproportie is een belangrijk middel voor de overheid om beslissingen te maken over de maatregelen in het land.
Wat is het verschil tussen de steekproefproportie en de populatieproportie?
Naast de steekproefproportie is er ook nog de populatieproportie. Deze twee termen worden vaak door elkaar gehaald. Hieronder zie je dat de symbolen van beide termen alleen maar van elkaar verschillen door het “dakje” op de “p”.
In het geval van het aantal mensen dat corona heeft gehad in Nederland, is de populatieproportie het daadwerkelijke percentage van de Nederlandse bevolking dat corona heeft gehad. Dat is natuurlijk precies wat de overheid wil weten. Maar zoals we eerder al hebben uitgelegd is het berekenen van deze populatieproportie niet haalbaar. Je moet iedere inwoner van Nederland op antistoffen testen. Daarom wordt er gekeken naar de steekproefproportie van een steekproef in Nederland.
Een representatieve steekproef moet dus een steekproefproportie opleveren die heel dicht ligt bij de populatieproportie. Als de steekproef van het RIVM representatief is dan zal de populatieproportie ook rond de 4% liggen. Als de steekproef van het RIVM niet representatief is dan kan de populatieproportie in werkelijkheid misschien wel 8% of 1% zijn.
Opdracht 1
Om de steekproef representatief te maken heeft het RIVM 2096 bloeddonaties onderzocht en hebben ze kandidaten uit verschillende leeftijdsgroepen gekozen: de leeftijden variëren tussen de 3 en 90 jaar. Wat had het RIVM nog meer kunnen doen om de steekproef zo aselect mogelijk te maken?
Naast verschillende leeftijdscategorieën is het ook belangrijk om ervoor te zorgen dat de mensen uit de steekproef uit verschillende regio’s komen. Als er 1000 mensen uit de steekproef uit Brabant komen, kan dit een verkeerd beeld geven omdat Brabant aan het begin van de crisis meer (vastgestelde) besmettingen had dan andere regio’s.
Opdracht 2
Begin augustus hebben 102.000 mensen zich laten testen. Waarom is deze groep geen representatieve steekproef als je wilt onderzoeken hoeveel mensen in Nederland corona hebben gehad?
Deze steekproef is niet aselect omdat er nu alleen maar mensen met klachten van het virus deelnemen aan de steekproef. Bij een aselecte steekproef willen we zowel mensen met klachten als zonder klachten in de steekproef hebben. Het zou kunnen dat iemand het virus heeft zonder klachten en die groep moet ook worden meegenomen in de steekproef.