Benfordův zákon

Benfordův zákon, někdy též Newcombův-Benfordův zákon, je matematický zákon, který říká, že v mnoha souborech přirozených dat začínají čísla mnohem častěji číslicí 1 než jinou číslicí. Zhruba 30 % čísel začíná jedničkou. Čím vyšší počáteční číslice je, tím méně pravděpodobně se vyskytuje na začátku čísel. (Více na wiki)

Aplikace tohoto zákona se používá na jednoduché odhalování například účetních podvodů. Není to důkaz sám o sobě, ale je to jisté vodítko, že s daty bylo manipulováno. A protože máme velké soubory dat z ÚZIS, nabízí se to tak nějak samo je otestovat pomocí Benfordova zákona.

První graf je jen ukázkou testu dvou sad dat. První sadou jsou data z ČSÚ z ročenek 2015-2020 úmrtí podle diagnóz (cca 7100 hodnot v rozmezí 1 – 11561). Druhá sada je uměle vygenerovaná ve stejném rozsahu jako je první, ale pomocí funkce random v jazyky Python.


Zatímco data z ČSÚ kopírují křivku vcelku věrně, náhodně generovaná čísla jsou až na 1 rozložena ve stejném poměru.

Přehled úmrtí podle očkování





Zdroj dat:
COVID-19: Přehled úmrtí s ohledem na vykázaná očkování

Přehledy JIP podle očkování





Zdroj dat:
COVID-19: Přehled hospitalizací na JIP s ohledem na vykázaná očkování

Přehledy hospitalací podle očkování





Zdroj dat:
COVID-19: Přehled hospitalizací s ohledem na vykázaná očkování

Přehledy pozitivních podle očkování





Zdroj dat:
COVID-19: Přehled osob s prokázanou nákazou s ohledem na vykázaná očkování

Přehledy – testy, nakažení, vyléčení a úmrtí

Data jsou od 27.1.2020, pro větší přehlednost jsou rozděleny na 4 grafy.


Tak tohle je dost podezřelé.



Zdroj dat:
COVID-19: Celkový (kumulativní) počet osob s prokázanou nákazou dle krajských hygienických stanic včetně laboratoří, počet vyléčených, počet úmrtí a provedených testů (v2)

Přehledy testů

Jedná se data o počtech provedených testů od 1.6.2020 a konkrétně o sloupce o počtech testů PCR a AG, které byly pozitivní ať symptomatické a nebo asypmtomatické.



Nějak to tu základní křivku nekopíruje, hlavně by tam neměly být „zuby“.
Zdroj dat:
COVID-19: Přehled provedených testů podle typu a indikace