statistiek

Charles BoothToen Charles Booth, de nieuwe voorzitter van de Royal Statistical Society, zich in de tweede helft van de 19de eeuw in Londen vestigde, schrok hij van de grote verschillen in sociale omstandigheden van de Londenaren. Booth startte zijn eigen sociologisch onderzoek. Hij was waarschijnlijk iemand die niet snel tevreden was, want het duurde achttien jaar voordat hij zijn bevindingen publiceerde in het zeventiendelige Life and Labour of the People in London. Daarin was een kaart opgenomen met de alleszeggende titel Descriptive Map of London Poverty 1889. Booth had rijkelijk kleuren gebruikt, om zijn indeling van de welstandsniveaus in zeven categorieën inzichtelijk te maken. Hij had de eerste demografische kaart gemaakt.

Ik vind drie zaken interessant aan Booth’s innovatie. In de eerste plaats het gegeven van de innovatie zelf, de nieuwe toepassing, als start van de demografie. Demografisch onderzoek wordt tot op de dag van vandaag intensief gebruikt door marketeers, verzekeringsmaatschappijen, kredietverstrekkers en andere beroepsgroepen die een inschatting willen maken van kansen en bedreigingen. In de tweede plaats was de invloed van Booth’s werk opmerkelijk. Dat resulteerde namelijk in de invoering van een staatspensioen in 1908, omdat Booth met zijn werk had aangetoond dat armoede, werkeloosheid, leeftijd en criminaliteit nauw met elkaar verbonden waren.

Het derde aspect dat me opvalt is de beschrijving van de zeven categorieën op de legenda. Enerzijds had die beschrijving ten grondslag gelegen aan de opgedane inzichten, anderzijds zat er een flink stigmatiserend element in. Ik geef ze je voluit, in aflopende volgorde, zodat je zelf kunt zien wat ik bedoel:

Poverty map van Charles Booth

  • Upper-middle and Upper classes. Wealthy.
  • Middle class. Well-to-do.
  • Fairly comfortable. Good ordinary earnings.
  • Mixed. Some comfortable, others poor.
  • Poor. 18S. to 21S. a week for a moderate family.
  • Very poor, casual. Chronic want.
  • Lowest class. Vicious, semi-criminal.

Booth leek met zijn ‘semi-criminal’ nog bijna een voorbehoud te willen maken (‘ik zeg niet dat het allemaal criminelen zijn hoor, die ‘lowest class people’, maar ze zitten er wel heel dicht tegenaan’), maar erg empathisch komt zijn legenda niet over. Ik stel me voor dat zo’n indeling, of een variant daarop, tegenwoordig gebruikt zou worden. Met de toevoeging van nog een karakteristiek, bijvoorbeeld etniciteit, zou je de maatschappelijk en politieke poppen helemaal aan het dansen krijgen.
Maar, zoals gezegd, hervormer Booth bereikte zijn doel, waar op zichzelf niemand iets op tegen had kunnen hebben, want de ‘Old Age Pensions Act’ bleek levensreddend voor miljoenen Britten.

Ik vind dat de Map of Poverty van Booth heel goed het spanningsveld liet zien waar cartografen en de gebruikers van kaarten – u en ik – voor staan. Een kaart laat zien wat de maker wil laten zien. Het resultaat hangt dus net zo sterk af van de bedoelingen van de maker als van de opgenomen gegevens. Een niet te onderschatten element uit het visuele spel is de gebruiker. Soms zijn dat getrainde deskundigen: artsen, militairen, statistici. Maar vaker zijn dat leken: loodgieters, advocaten, schooljuffen en bankemployees, die alleen hun gezonde verstand kunnen inzetten om het bekijken van een kaart tot een goed en ongeschonden einde te brengen. Een klein beetje gezond wantrouwen zou hierbij behulpzaam kunnen zijn, lijkt mij.

CholeraNadat ik kennis had gemaakt met de evolutiekaart van William Smith begon ik het vertrouwen in de goede bedoelingen van de meeste cartografen weer een beetje terug te krijgen. Een volgend voorbeeld dat hier aan bijdroeg was een 19e eeuwse kaart, die vrijwel geen enkele esthetische waarde had, maar puur in het teken had gestaan van wetenschappelijke vooruitgang. Het ging om de kaart van de Engelse arts John Snow in 1855. Onderwerp: cholera.

Snow was werkzaam in Londen, een stad die te lijden had onder een oncontroleerbare cholera-epidemie. Er was een probleem dat nog groter genoemd kon worden dan de ziekte zelf, namelijk de totale onwetendheid over de oorzaak en de wijze van verspreiding van de ziekte. De Italiaanse term voor slechte lucht, ‘mal aria’, toonde al aan dat de artsen in die tijd wel eens mis zaten met hun verklaringen; de term werd gegeven aan een ziekte die helemaal niet door de lucht werd overgebracht, maar door een mug. Ook in het geval van cholera dacht men dat men de oorzaak in rondvliegende luchtdeeltjes moest zoeken.
John Snow had er een ander idee over. Hij had weliswaar een hypothese, maar wilde die eerst staven, voordat hij er mee naar buiten trad. Dat deed hij door het maken van een kaart van de wijk Soho. Het was een arme wijk, waar mensen onder slechte omstandigheden moesten zien te overleven. Snow was doortastend. Hij ging alle huizen langs en stelde twee vragen: zijn hier gevallen van cholera, en van welke leverancier betrekt u het drinkwater? Er waren namelijk twee waterbedrijven, die soms in dezelfde straat hun klandizie hadden. De mensen haalden hun drinkwater bij de pomp in de straat, die in verbinding stond met ondergrondse opslagtanks. Toen Snow de antwoorden op zijn vragen in zijn kaart intekende – een zeer eenvoudig uitziende zwart-wit tekening, zonder enige vorm van opsmuk – werd het patroon snel zichtbaar. Veruit de meeste slachtoffers waren gevallen in Broad Street, waar één pomp aanwezig was, namelijk die van Southwork & Vauxhall. Ook in andere straten waren de choleragevallen gegroepeerd rond de pompen van dit waterbedrijf, terwijl de mensen die de pompen van de Lambeth Company gebruikten buiten schot waren gebleven. Het verschil zat hem hierin, dat de Lambeth Company zijn water stroomopwaarts uit de Thames haalde, terwijl Southwork & Vauxhall dat uit de vervuilde benedenloop deed, stroomafwaarts dus, vlak na de plek waar de riolen in de Thames uitkwamen. John SnowSnow had natuurlijk niet blindelings zomaar iets grafisch uitgezet. Het was geen schot in het duister geweest; hij had wel degelijk een idee gehad waar hij naar op zoek moest gaan. Toch werd de waarde van zijn hypothese pas evident door de eenvoudige maar doeltreffende kaart die hij had gemaakt. De pomp in Broad Street werd afgesloten, en de uitbraken van cholera stopten onmiddellijk. Snow stelde dat cholera en veel andere infectieziekten werden veroorzaakt door de verspreiding van heel kleine diertjes. Dat was wel eens eerder geopperd, maar nooit erg serieus genomen. Totdat hij met zijn kaart kwam. Het bestaan van deze ziektekiemen zou nog in dezelfde eeuw worden aangetoond.

Stephen Unwin, waarover ik in mijn vorige blog schreef, vond dat hij kon uitrekenen dat de kans dat God bestaat 67% is. De Franse Blaise Pascal ging in 1669 nog een stap verder. Hij rekende uit wat de gevolgen zijn van wel of niet geloven. Deze Franse wis- en natuurkundige maakte hierbij dankbaar gebruik van het wiskundige begrip ‘oneindig’. Zijn redenering omvatte twee mogelijke scenario’s: één waarin God wel bestaat, en één waarin Hij niet bestaat. De gok van Pascal.

Stel (eerste scenario): God bestaat niet. Aan het eind van je leven gekomen heb je het dan als gelovige weliswaar je hele leven bij het verkeerde einde gehad, maar ach, niks aan de hand. Je gaat dood, en er is niks meer. Einde verhaal. Uitkomst: geen schade. De niet-gelovige had het al die tijd juist. Ook dood. Ook geen schade. Verschilletje: Pascal beredeneert dat het in dit scenario toch beter is om in God te geloven, want gelovigen leiden betere levens en maken de wereld een stukje beter, volgens hem. Een klein maar niet onbelangrijk voordeel voor geloven dus, in dit scenario.
Het tweede scenario is: God bestaat wel. De gelovige wacht de eeuwige hemelse velden van geluk, want hij was in zijn aardse leven immers fan van de juiste club, want hem recht geeft op gratis toegang. Oneindig lang. En dus is zijn geluk oneindig groot. De heiden wacht een ander lot, volgens de gok van Pascal. Hij die het zijn hele leven heeft vertikt om de Waarheid en er daardoor waarschijnlijk op los geleefd heeft te zien krijgt voor straf een toegangskaartje voor de hel. Oneindig lang. Niet leuk.
Tot zover lijken deze scenario’s vooral op iets wat misschien iedereen had kunnen verzinnen. Maar Pascal maakte deze beredenering helemaal af met toevoeging van rekenwerk. Gesteld dat de kans dat God bestaat heel klein zou zijn, bijvoorbeeld één procent, dan zouden de uitkomsten ‘hemel’ en ‘hel’ nog steeds oneindig groot zijn. Want: 1% van oneindig is nog steeds oneindig. Zoals ook 0,000000000000001% van oneindig nog steeds oneindig is. Dat betekent in scenario 1 (God bestaat niet) een uitkomst van nul. Niks. Maar scenario twee komt op oneindig lang leed (voor de ongelovige) of oneindig paradijs (voor de gelovige). Ergo: Pascal beredeneerde dat het statistisch gezien het beste is om in God te geloven, los van of Hij nou wel of niet bestond. De uitkomst van wat later bekend is geworden als ‘De Gok van Pascal’ is dan ook: neem aan dat God bestaat.

Elke wiskundige zal onderschrijven dat een hele kleine kans op oneindigheid nog steeds oneindigheid als rekenkundige uitkomst zal hebben. In dat opzicht lijkt Pascal’s redenatie te staan als een huis. Niemand wil toch kiezen voor een oneindig bestaan in de hel? Dus: heeft Pascal gelijk? Doen ongelovigen er goed aan om zich te bekeren? Om die vraag te kunnen beantwoorden is het nodig om de argumentaties van Blaise Pascal eens aan een kritische analyse te onderwerpen. Niet zozeer om het eindresultaat te bekritiseren, maar om na te gaan waar eventuele valkuilen zitten in de uiteenzetting.
De belangrijkste valkuil in ‘De Gok van Pascal’ is in eerste instantie misschien niet eens zo heel zichtbaar. Die zit in de stap tussen uitkomst en bewijs. Dat het statistisch gezien het veiligst zou zijn om in God te geloven is nog geen bewijs voor zijn bestaan. Het is alleen de uitkomst van een rekensom.
Een ander probleem in ‘De Gok van Pascal’ is op het eerste gezicht misschien ook niet zo heel erg duidelijk, maar is wel helder te maken. En wel als volgt: als ik stel dat er naast de God van Pascal nog een andere God bestaat (laten we hem Joris noemen), kan ik daar dezelfde beredenering op los laten. Maar als ik toevoeg dat bij Joris een duivel en een hel hoort die oneindig veel erger zijn dan die van de Christelijk God van Pascal, is het statistisch gezien veiliger om in Joris te geloven dan in die van Pascal. Ergo: je kunt beter aannemen dat mijn God, mijn duivel en mijn hel bestaan.
Graag gedaan.

Wil je ontdekkingsschrijvernieuws blijven ontvangen? Meld je dan aan voor ontvangst van de nieuwsbrief. Of volg @MichielvStraten op Twitter.

(Lees meer over onze irrationele omgang met geloof in mijn boek dat verschijnt in het voorjaar van 2016. Zie ook https://www.ontdekkingsschrijver.nl/boeken/.)

The probability of GodDe Britse natuurkundige Stephen Unwin ‘bewees’ in 2003 dat het zeer waarschijnlijk is dat God bestaat. Nee, vergeef me, ik moet preciezer zijn (want dat was hij ook): hij rekende uit dat de kans dat God bestaat 67% is. Jawel! Voor deze opzienbarende rekensom combineerde hij zijn kundigheid in de kansberekening met zijn geloof als, tja, gelovige. Unwin maakte bij zijn zoektocht naar de Waarheid gebruik van Bayesiaanse statistiek. Voor de paar lezers onder u die geen expert zijn in die tak van de statistiek zal ik Unwin’s rekensom even toelichten. Geen nood, het is niet ingewikkeld.

Unwin begon met het uitgangspunt dat, wanneer er aangaande het bestaan van God twee mogelijke uitkomsten zijn (hij bestaat wel of hij bestaat niet), we er goed aan doen om elk van die twee mogelijkheden dezelfde kans toe te dichten. Gevalletje fifty-fifty dus. De Bayesiaanse statistiek schrijft voor dat je vervolgens argumenten introduceert en die vervolgens elk een waarde geeft. Al die waardes hebben invloed het gekozen uitgangspunt van, in dit geval, 50-50. Unwin voerde zes argumenten in in zijn Bayesiaans rekenmodel. Zijn eerste argument betrof het bestaan van goedheid. De net genoemde statistische a priori kans dat God bestaat op 50% stijgt hierdoor volgens Unwin naar een a posteriori waarschijnlijkheid van 91%*. Dat tikt lekker aan. Helaas daalt dat percentage door het invoeren van het volgende argument, zijnde het bestaan van menselijke slechtheid, naar 83%. Valt nog mee. Natuurlijke slechtheid (aardbevingen, kanker, enzovoort) krijgt een zwaardere invloed, want de kans op Gods echtheid daalt hierdoor ineens naar 33%. Wonderen en religieuze ervaringen van gelovigen (!) doen uiteindelijk het rekenwerk eindigen in de eerder genoemde 67% kans op het bestaan van God.

Iedereen mag hier natuurlijk het zijne van denken. En ik denk er het mijne van. En ik wil je ook uitleggen waar dat laatste uit bestaat. Want Unwin ging duidelijk niet over één nacht ijs. En dat doe ik ook niet.
Unwin doet alsof het logisch is om als uitgangspunt te nemen dat de a priori kans dat God bestaat fifty-fifty is. Dat is hetzelfde als besluiten dat de a priori kans op het bestaan van Marsmannetjes 50% is; ook daarvoor zijn er namelijk slechts twee mogelijkheden: ze bestaat wel of ze bestaan niet. (Nog beter illustreert de sollicitant dit, op gesprek bij het Centraal Bureau voor Statistiek voor de functie van statistisch medewerker. ‘Er staat hier een schaal met knikkers’, zegt de personeelsmanager tegen hem. ‘Er zit 1 rode knikker in en 99 blauwe. Wat is de kans dat u, zonder te kijken, de rode pakt?’ De sollicitant denkt even na en zegt dan: ‘Vijftig procent: je pakt hem wel of je pakt hem niet!’ Slechte grap? Misschien. Maar dat was een grap, en grappen mogen slecht zijn. Serieus bedoelde rekensommen niet.)
Speciale aandacht vraag ik voor de twee laatstgenoemde van Unwin’s argumenten: het bestaan van wonderen en religieuze ervaringen. Is dit soort ‘gebeurtenissen’ nou net niet voorbehouden aan, eh, gelovigen?
Vervolgens rammel ik nog even aan de verder zo onberispelijk ogende rekenkundige benadering van Unwin’s statistische benadering. Hoewel de kwantificering van elk door Unwin genoemd argument zijn werkwijze doet lijken als iets met een hoog objectiviteitsgehalte, stort dat idee als een kaartenhuis in elkaar wanneer je je realiseert dat het lijstje door Unwin opgevoerde argumenten volkomen arbitrair is. De genoemde pro-argumenten zijn beargumenteerbaar. Ze zijn aanvulbaar met een oneindig scala van contra-argumenten, waarvan Unwin er echter slechts twee (!) opnam in zijn berekening. (Dat scala hoef ik toch niet te noemen hier? Pak de krant van vandaag er even bij, en je hebt al snel een representatief lijstje.) En voor de oplettende lezer: inderdaad is het lijstje pro-argumenten ook aan te vullen met tal van nog niet door Unwin genoemde goedheden. En zelfs die constatering doet eerder afbreuk het Godsbewijs van Unwin dan dat het de boel verstevigt, want het laat zien dat je vooral eruit krijgt wat je er zelf in stopt.

Unwin noemde zijn methode ‘A simple calculation that proves the ultimate truth’. De eerste drie woorden uit dat citaat lijken me juist.

* Als je precies wilt weten hoe Unwin zijn rekensom uitvoerde verwijs ik je naar zijn boek The Probability of God (Three Rivers Press, 2003).

(Lees meer over onze irrationele omgang met geloof in mijn boek dat verschijnt in het voorjaar van 2016. Zie ook https://www.ontdekkingsschrijver.nl/boeken/.)

Nieuwsbrief
Blijf op de hoogte van nieuws, verhalen en andere ontdekkingsschrijverij. Je kunt je hier aanmelden voor mijn maandelijkse nieuwsbrief.