Statistiek

Een Belgische politicus zei eens: ‘Ik geloof niet in bijgeloof, want dat brengt ongeluk.’ Wat zou hij vinden van de vermeende ongeluksdag vrijdag de 13e? Waar komt dat bijgeloof trouwens vandaan? En zit er nog enige waarheid in genoemd citaat?
In de Verenigde Staten, een land dat in alles groot wil zijn, speelt vrijdag de 13e een veel bepalender rol dan in ons nuchtere landje. Er zijn daar zelfs mensen die op deze dag niet naar hun werk gaan, om zo de kans op onheil te reduceren. Maar niet alleen in de VS, ook in andere landen blijkt men zoveel moeite te hebben met alleen al het getal 13, dat dat daarom veelal gemeden wordt. Bij meerdere vliegmaatschappijen springt de nummering van de rijen van rij 12 naar rij 14; op sommige vliegvelden gebeurt hetzelfde met de aanduiding van de gates, en in veel Amerikaanse gebouwen zult u tevergeefs naar een 13e verdieping zoeken.
Er is een aantal mogelijke verklaring voor de negatieve verwachting bij vrijdag de 13e. Eén ervan heeft te maken met de kruisiging van Jezus, die op een vrijdag plaatsvond. Het getal 12 wordt in de bijbel (en in de numerologie) als volmaakt gezien – een perfectie die door de dertiende aangezetene aan het laatste avondmaal, Judas, op meerdere manieren werd verstoord. Een andere mogelijke verklaring met een religieuze achtergrond heeft te maken met de ondergang van de Tempeliers, een militair ingestelde monnikenorde, op vrijdag 13 oktober van het jaar 1307. Ook is een oorsprong te vinden in de Noorse sage over de God Loki. Deze kwaadaardige God kwam als dertiende en ongenodigde op een wereldfeest, en bracht allerlei onheil over de wereld.
Indachtig de uitspraak van de 19 eeuwse Engelse historicus Henry Thomas Buckle – ‘De enige remedie tegen bijgeloof is wetenschap’ – vroeg ik eens aan het LUMC wat de afgelopen exemplaren van vrijdag de 13e op de spoedeisende hulp heeft opgeleverd. ‘Er is in de cijfers niets terug te vinden van afwijkingen van andere vrijdagen’, aldus Sonja Groen, communicatiemedewerkster. ‘Deze twee vrijdagen gaven een normale drukte.’ Houdt het LUMC op enige manier rekening met het getal 13? ‘Nee hoor’, antwoordt Groen, ‘we nummeren bijvoorbeeld de operatiekamers gewoon door, tot in de twintig.’
Het Centrum voor Verzekeringsstatistiek bekeek naar het aantal verkeersongelukken en brandmeldingen in een jaar, en onderzocht de verhouding tussen die op vrijdag de 13e enerzijds en andere vrijdagen anderzijds. Waar verzekeraars op de meeste vrijdagen ongeveer 7.800 schademeldingen binnen kregen, bleef de teller op een vrijdag de 13de stil staan op gemiddeld 7.500 gevallen. Ook het aantal brandmeldingen op vrijdag de 13de lag net iets lager dan doorgaans op vrijdag. Misschien komt dat, doordat mensen op deze dag iets voorzichtiger doen dan op andere dagen. Dat lijkt erop te wijzen dat er meer waarheid zit in de woorden van de geciteerde Belgische politicus, dan in het bijgeloof zelf.

(Dit stuk is eerder gepubliceerd geweest in het Leidsch Dagblad in de rubriek ‘De Kwestie’.)

ElfstedentochtIn 1909 werd de eerste Elfstedentocht gereden. De laatste was in 1997, met Henk Angenent als winnaar. Wanneer de temperaturen dalen, krijgen veel schaatsers het juist warm: de Elfstedenkoorts slaat weer toe. Om deze liefhebbers, en alle passieve genieters van dit stuk van onze nationale identiteit, niet in volslagen onwetendheid te laten voor wat betreft de kans op een nieuwe tocht der tochten, vroeg ik aan de klimaatdesk van het KNMI of dat te berekenen is. Hun antwoord: ‘In de 20ste eeuw was met 15 Elfstedentochten de kans op een tocht ongeveer 1 op 6 (dus gemiddeld eens per zes jaar een tocht). Door de opwarming van de aarde neemt echter ook de wintertemperatuur in Nederland toe, waardoor tijdens een vorstperiode het ijs minder dik wordt dan voorheen. De voor een Elfstedentocht benodigde ijsdikte wordt dus ook minder snel bereikt en de kans op een tocht neemt af.’

‘Klimaatmodellen geven aan dat door het broeikaseffect de wereldgemiddelde temperatuur in de 21ste eeuw langzaam verder stijgt. Wat betekent dat voor de Elfstedentocht? Voor de 20ste eeuw kennen we de relatie tussen de gemiddelde wintertemperatuur en de bereikte maximale ijsdikte in een winter. Wanneer we die relatie combineren met de door de klimaatmodellen verwachte stijging in de gemiddelde wereldtemperatuur, kunnen we een schatting geven van het te verwachten aantal Elfstedentochten in de 21ste eeuw. We komen dan uit op een aantal van 4 tot 10 tochten, dus een stuk minder dan de 15 tochten in de 20ste eeuw. Omdat Nederland in de winter op dit moment sneller opwarmt dan de totale aarde, is deze schatting mogelijk nog te optimistisch, voor de schaatsliefhebbers althans. Gegeven deze snellere opwarming, is een ruwe schatting van de huidige kans op een Elfstedentocht ongeveer 1 op 10 á 1 op 12.’

Hoe de praktijkmensen hier mee om gaan wil ik weten van de Leidse langeafstandsschaatser Bert Breed, die in 1997 de tocht uitschaatste. ‘Op zich zal deze kansberekening wel kloppen, maar ik vaar er niet blind op. Het zegt iets over de trend, maar niets over de concrete werkelijkheid. De kans was tot 1987 eens in de 4 á 5 jaar en na de temperatuursprong in 1988 eens in de 7 jaar. Overzien we de afgelopen 50 jaar, dan zouden er 7 geweest moeten zijn met deze kansberekening. Het waren er maar 4, dus eens in de 12,5 jaar. Bijna de helft van waar we volgens de kansberekening “recht” op hadden!’ Praktijkman Breed betoogt verder dat de windrichting en de hoeveelheid sneeuw ook nog eens van invloed kunnen zijn op hoe schaatsbaar het ijs is, dus ‘het kwartje moet gewoon goed vallen’, is zijn conclusie. ‘We moeten gewoon afwachten en ondertussen gewoon keihard doortrainen. Het lot van de Elfstedenrijder is, dat je elke winter de hele winter in vorm moet zijn, want je weet maar nooit.’

Cliff ArnallEen uitgerekend vrolijke manier om tegen het fenomeen ‘datum’ aan te kijken komt van de Britse psycholoog Cliff Arnall. Hij bedacht een manier om uit te rekenen wat de vrolijkste dag van het jaar is. Zijn methode bevat elementen als buiten zijn (O), natuur (N), sociale interactie (S), positieve herinneringen aan jeugdige zomers (Cpm), temperatuur (T) en het vooruitzicht op vakantie (He). Arnall heeft deze elementen zelfs in een heuse formule gegoten (O + (N x S) + Cpm/T + He), maar ook zonder deze formule is duidelijk dat de gelukkigste dag van het jaar op deze manier volgens Arnall op of rond 21 juni moet vallen. Dat deze uitkomst (en de gehele formule) nadrukkelijk door het bedrijf Wall’s Ice Cream is gepresenteerd in een opbeurend zomers persbericht zegt waarschijnlijk evenveel over de vrolijkheid van de uitgerekende dag als over de stemming van Cliff Arnall zelf, bij het verzinnen van deze formule.

Arnaal moet hij gedacht hebben, bij elke yin hoort een yang, want ook voor het bepalen van de meest deprimerende dag van het jaar bedacht hij een formule. Een formule die er even indrukwekkend als ondoorgrondelijk uitziet, met elementen als het weer, financiële situatie, het aantal dagen sinds Kerstmis, de tijd die verstreken is sinds het niet nakomen van goede voornemens, het persoonlijke motivatieniveau en de mate waarin iemand voelt actie te moeten ondernemen:

[W + (D – d)] x TQ
———————-
M x NA
(W = het weer; D = schulden; d = salaris; T = de tijd die verstreken is sinds Kerstmis; Q = de tijd die verstreken is sinds uw laatste stoppoging; M = motivatie; NA is de noodzaak om actie te ondernemen.)
Ergens tussen 18 en 24 januari bent u volgens Arnall het minst vrolijk. Het is maar dat u het weet.

(Dit is een fragment uit mijn boek Tien verdwenen dagen – over de menselijke maat achter ons wereldbeeld.)

Charles BoothToen Charles Booth, de nieuwe voorzitter van de Royal Statistical Society, zich in de tweede helft van de 19de eeuw in Londen vestigde, schrok hij van de grote verschillen in sociale omstandigheden van de Londenaren. Booth startte zijn eigen sociologisch onderzoek. Hij was waarschijnlijk iemand die niet snel tevreden was, want het duurde achttien jaar voordat hij zijn bevindingen publiceerde in het zeventiendelige Life and Labour of the People in London. Daarin was een kaart opgenomen met de alleszeggende titel Descriptive Map of London Poverty 1889. Booth had rijkelijk kleuren gebruikt, om zijn indeling van de welstandsniveaus in zeven categorieën inzichtelijk te maken. Hij had de eerste demografische kaart gemaakt.

Ik vind drie zaken interessant aan Booth’s innovatie. In de eerste plaats het gegeven van de innovatie zelf, de nieuwe toepassing, als start van de demografie. Demografisch onderzoek wordt tot op de dag van vandaag intensief gebruikt door marketeers, verzekeringsmaatschappijen, kredietverstrekkers en andere beroepsgroepen die een inschatting willen maken van kansen en bedreigingen. In de tweede plaats was de invloed van Booth’s werk opmerkelijk. Dat resulteerde namelijk in de invoering van een staatspensioen in 1908, omdat Booth met zijn werk had aangetoond dat armoede, werkeloosheid, leeftijd en criminaliteit nauw met elkaar verbonden waren.

Het derde aspect dat me opvalt is de beschrijving van de zeven categorieën op de legenda. Enerzijds had die beschrijving ten grondslag gelegen aan de opgedane inzichten, anderzijds zat er een flink stigmatiserend element in. Ik geef ze je voluit, in aflopende volgorde, zodat je zelf kunt zien wat ik bedoel:

Poverty map van Charles Booth

  • Upper-middle and Upper classes. Wealthy.
  • Middle class. Well-to-do.
  • Fairly comfortable. Good ordinary earnings.
  • Mixed. Some comfortable, others poor.
  • Poor. 18S. to 21S. a week for a moderate family.
  • Very poor, casual. Chronic want.
  • Lowest class. Vicious, semi-criminal.

Booth leek met zijn ‘semi-criminal’ nog bijna een voorbehoud te willen maken (‘ik zeg niet dat het allemaal criminelen zijn hoor, die ‘lowest class people’, maar ze zitten er wel heel dicht tegenaan’), maar erg empathisch komt zijn legenda niet over. Ik stel me voor dat zo’n indeling, of een variant daarop, tegenwoordig gebruikt zou worden. Met de toevoeging van nog een karakteristiek, bijvoorbeeld etniciteit, zou je de maatschappelijk en politieke poppen helemaal aan het dansen krijgen.
Maar, zoals gezegd, hervormer Booth bereikte zijn doel, waar op zichzelf niemand iets op tegen had kunnen hebben, want de ‘Old Age Pensions Act’ bleek levensreddend voor miljoenen Britten.

Ik vind dat de Map of Poverty van Booth heel goed het spanningsveld liet zien waar cartografen en de gebruikers van kaarten – u en ik – voor staan. Een kaart laat zien wat de maker wil laten zien. Het resultaat hangt dus net zo sterk af van de bedoelingen van de maker als van de opgenomen gegevens. Een niet te onderschatten element uit het visuele spel is de gebruiker. Soms zijn dat getrainde deskundigen: artsen, militairen, statistici. Maar vaker zijn dat leken: loodgieters, advocaten, schooljuffen en bankemployees, die alleen hun gezonde verstand kunnen inzetten om het bekijken van een kaart tot een goed en ongeschonden einde te brengen. Een klein beetje gezond wantrouwen zou hierbij behulpzaam kunnen zijn, lijkt mij.

Naast manipulatieve kaarten bestaan er gelukkig ook ‘goede kaarten’. Ik kwam eens een kaart tegen, die zo mooi was, dat ik ‘m onmiddellijk aan de muur zou willen hangen. De wereld stond er twee keer op. Bijna ouderwets, zou ik zeggen, met bollingen die zo ongeveer de kaart uit kwamen zetten.
Moeder aarde presenteerde zich hier. Het papier waarop de kaart was afgedrukt had een lichtbruine gloed over zich, wat het een authentieke uitstraling gaf. Het leek wel een zeldzaam kunstwerk. De bovenste afbeelding had veel groene vlakken, de onderste rode strepen. Die kleuren pasten mooi bij het bruine papier. Er was nog een inzetje met een vrolijk kleurrijk Europa, en in elke hoek stonden verklarende teksten. Het zou in elke kamer in ons huis kunnen verrijken met zijn aanwezigheid.
Bij nadere bestudering moest ik concluderen dat de kaart weliswaar vrolijk oogde, maar desondanks een treurige boodschap bevatte. Hij kwam uit de Berghaus Physikalischer Atlas van 1886 en heette ‘Verbreitung von Krankheiten – Endemische Krankheiten des 19. Jahrhunderts’.
De kaart was misschien wel tekenend voor zijn tijd. De wereld was geografisch gezien al in kaart gebracht – hoewel er geenszins eenduidigheid was over de manier waarop dat het beste kon gebeuren, zo was me duidelijk geworden – en er was zich een nieuw soort kaart aan het ontwikkelen: de thematische kaart. Hierbij ging het niet in eerste instantie om het weergeven van plaatsen en gebieden op hun geografische positie, maar om gegevens over de bevolking van de gebieden, of verschijnselen waar de cartografie in een zoektocht voorzag. Die bijna essayistische kaarten vond ik zeer boeiend. Ze waren het resultaat van speurtochten, die vaak met onbekende afloop door gepassioneerde (amateur)cartografen waren aangevangen, en uiteindelijk in veel gevallen zeer constructieve bijdragen hadden opgeleverd.
Het boek How to Lie with Maps verdient een waardige opvolger. Wie schrijft How to Solve Problems with Maps?

The probability of GodDe Britse natuurkundige Stephen Unwin ‘bewees’ in 2003 dat het zeer waarschijnlijk is dat God bestaat. Nee, vergeef me, ik moet preciezer zijn (want dat was hij ook): hij rekende uit dat de kans dat God bestaat 67% is. Jawel! Voor deze opzienbarende rekensom combineerde hij zijn kundigheid in de kansberekening met zijn geloof als, tja, gelovige. Unwin maakte bij zijn zoektocht naar de Waarheid gebruik van Bayesiaanse statistiek. Voor de paar lezers onder u die geen expert zijn in die tak van de statistiek zal ik Unwin’s rekensom even toelichten. Geen nood, het is niet ingewikkeld.

Unwin begon met het uitgangspunt dat, wanneer er aangaande het bestaan van God twee mogelijke uitkomsten zijn (hij bestaat wel of hij bestaat niet), we er goed aan doen om elk van die twee mogelijkheden dezelfde kans toe te dichten. Gevalletje fifty-fifty dus. De Bayesiaanse statistiek schrijft voor dat je vervolgens argumenten introduceert en die vervolgens elk een waarde geeft. Al die waardes hebben invloed het gekozen uitgangspunt van, in dit geval, 50-50. Unwin voerde zes argumenten in in zijn Bayesiaans rekenmodel. Zijn eerste argument betrof het bestaan van goedheid. De net genoemde statistische a priori kans dat God bestaat op 50% stijgt hierdoor volgens Unwin naar een a posteriori waarschijnlijkheid van 91%*. Dat tikt lekker aan. Helaas daalt dat percentage door het invoeren van het volgende argument, zijnde het bestaan van menselijke slechtheid, naar 83%. Valt nog mee. Natuurlijke slechtheid (aardbevingen, kanker, enzovoort) krijgt een zwaardere invloed, want de kans op Gods echtheid daalt hierdoor ineens naar 33%. Wonderen en religieuze ervaringen van gelovigen (!) doen uiteindelijk het rekenwerk eindigen in de eerder genoemde 67% kans op het bestaan van God.

Iedereen mag hier natuurlijk het zijne van denken. En ik denk er het mijne van. En ik wil je ook uitleggen waar dat laatste uit bestaat. Want Unwin ging duidelijk niet over één nacht ijs. En dat doe ik ook niet.
Unwin doet alsof het logisch is om als uitgangspunt te nemen dat de a priori kans dat God bestaat fifty-fifty is. Dat is hetzelfde als besluiten dat de a priori kans op het bestaan van Marsmannetjes 50% is; ook daarvoor zijn er namelijk slechts twee mogelijkheden: ze bestaat wel of ze bestaan niet. (Nog beter illustreert de sollicitant dit, op gesprek bij het Centraal Bureau voor Statistiek voor de functie van statistisch medewerker. ‘Er staat hier een schaal met knikkers’, zegt de personeelsmanager tegen hem. ‘Er zit 1 rode knikker in en 99 blauwe. Wat is de kans dat u, zonder te kijken, de rode pakt?’ De sollicitant denkt even na en zegt dan: ‘Vijftig procent: je pakt hem wel of je pakt hem niet!’ Slechte grap? Misschien. Maar dat was een grap, en grappen mogen slecht zijn. Serieus bedoelde rekensommen niet.)
Speciale aandacht vraag ik voor de twee laatstgenoemde van Unwin’s argumenten: het bestaan van wonderen en religieuze ervaringen. Is dit soort ‘gebeurtenissen’ nou net niet voorbehouden aan, eh, gelovigen?
Vervolgens rammel ik nog even aan de verder zo onberispelijk ogende rekenkundige benadering van Unwin’s statistische benadering. Hoewel de kwantificering van elk door Unwin genoemd argument zijn werkwijze doet lijken als iets met een hoog objectiviteitsgehalte, stort dat idee als een kaartenhuis in elkaar wanneer je je realiseert dat het lijstje door Unwin opgevoerde argumenten volkomen arbitrair is. De genoemde pro-argumenten zijn beargumenteerbaar. Ze zijn aanvulbaar met een oneindig scala van contra-argumenten, waarvan Unwin er echter slechts twee (!) opnam in zijn berekening. (Dat scala hoef ik toch niet te noemen hier? Pak de krant van vandaag er even bij, en je hebt al snel een representatief lijstje.) En voor de oplettende lezer: inderdaad is het lijstje pro-argumenten ook aan te vullen met tal van nog niet door Unwin genoemde goedheden. En zelfs die constatering doet eerder afbreuk het Godsbewijs van Unwin dan dat het de boel verstevigt, want het laat zien dat je vooral eruit krijgt wat je er zelf in stopt.

Unwin noemde zijn methode ‘A simple calculation that proves the ultimate truth’. De eerste drie woorden uit dat citaat lijken me juist.

* Als je precies wilt weten hoe Unwin zijn rekensom uitvoerde verwijs ik je naar zijn boek The Probability of God (Three Rivers Press, 2003).

(Lees meer over onze irrationele omgang met geloof in mijn boek dat verschijnt in het voorjaar van 2016. Zie ook https://www.ontdekkingsschrijver.nl/boeken/.)

Nieuwsbrief
Blijf op de hoogte van nieuws, verhalen en andere ontdekkingsschrijverij. Je kunt je hier aanmelden voor mijn maandelijkse nieuwsbrief.