Alle spreadsheets die je hier kunt downloaden zijn gemaakt met Excel 2010. Ik heb geen bijzondere mogelijkheden van Excel gebruikt zodat ze ook te gebruiken zijn met andere spreadsheetprogramma's. Met de nieuwste versies van libre-office en planmaker zijn de kleuren in de grafiek niet goed, maar verder werken ze goed. Bij Planmaker (ofwel softmaker) zijn de getallen langs de assen soms niet helemaal goed. Apache OpenOffice geeft zoveel problemen dat ik het gebruik afraad. Ik heb steeds de Nederlandse versies gebruikt. In theorie moet de internationale versie de gebruikte functies zelf aanpassen, maar of dat ook werkt.... ik hoor het graag!

De wet van Benford

● Echte datasets

Hier is een lijst met aantal inwoners en oppervlaktes van alle Nederlandse gemeentes. Er zijn bijna 400 getallen. Je ziet dat de wet van Benford daarmee al vrij goed voldoet.
   

Download hier het bijbehorende rekenblad GegevensGemeentenNederland.xlsx. Er zijn 2 tabbladen.

De wet zal beter voldoen als er meer getallen zijn. Daarom heb ik een lijst met het aantal inwoners van alle counties uit de Verenigde Staten gemaakt. Deze bestaat uit meer dan 3000 getallen. Deze voldoet dan ook veel beter aan de wet van Benford.

Benford voor inwonertal van 3142 counties.

Download hier het bijbehorende rekenblad Benford US_Counties.xlsx.

● Wiskundig berekende datasets

Hieronder vind je de wet voor de Fibonaccireeks. Je ziet hoe goed deze getallen aan de wet van Benford voldoen.

De getallen uit de Fibonacci reeks voldoen perfect.

Download hier het bijbehorende rekenblad Benford Fibonacci.xls.

Met een willekeurige factor.

Ook hier gebruik ik de gegevens van de Amerikaanse counties, omdat dat overtuigender is dan een wiskundig berekende verdeling. Je kunt in het rekenblad zelf een factor instellen om een en ander uit te testen. Als je een kommagetal kiest zorg er dan wel voor dat getal niet te klein is, want alle waarden moeten boven 1 blijven liggen.

De resultaten zijn erg overtuigend...

Download hier het bijbehorende rekenblad Benford US_Counties Factor.

Andere talstelsels

Voor de echte dataset gebruik ik weer de Amerikaanse counties. In het spreadsheet zijn de formules voor de hexadecimale wet en de octale wet opgenomen op een eigen tabblad.

Voor het hexadecimale stelsel

Voor het octale stelsel


Download hier het bijbehorende rekenblad Benford US_Counties hex en oct.xlsx. Er zijn twee tabbladen.

Twee begincijfers

● Echte data

Hier hebben we veel getallen nodig, omdat we per cijferpaar een lage frequentie verwachten. Dus gebruik ik weer de counties.

Een beter "bewijs" voor de wet van Benford heb ik nog niet gezien!
Download hier het bijbehorende rekenblad Benford US_Counties 2 cijfers.xlsx.

● Wiskundig berekende data, met exponentiële groei

Hier zie je dat de getallen die je krijgt bij exponentiële groei perfect voldoen aan de wet van Benford voor Benford voor de eerste twee begincijfers. Ook voor het tweede cijfer alleen kun je berekenen hoe vaak die voorkomen. Dan zijn de verschillen wel een stuk minder groot: het cijfer 0 komt in 12% van de gevallen voor en het cijfer 9 in 8,5 procent van de gevallen. Zou je naar het derde cijfer, of nog verder kijken dan zijn er nauwelijks meer verschillen. Om deze simulatie mogelijk te maken heb ik de getallen als ze te groot werden voor de standaard notatie 19 nullen afgehaald. Dit heeft geen gevolgen voor de verdeling van de begincijfers.

De getallen bij exponentiële groei voldoen (ook theoretisch) aan de wet van Benford
Hier zie je dat voor de eerste twee cijfers.

Ook als je alleen naar het tweede cijfer kijkt en het eerste negeert is er een (geringe) afname. Let op: de verticale schaal begint niet bij 0.
De blauwe lijn geeft de verdeling die je kunt afleiden uit de wet van Benford.

Download hier het bijbehorende rekenblad Benford exponentieel 2 cijfers.xlsx. Er zijn 2 tabbladen.