RKI folgt meiner Methode zur Schätzung einer stabilen Reproduktionszahl.

Seit 14. Mai 2020 ermittelt das Robert Koch-Institut die Reproduktionszahl nun auch als stabile Kennziffer auf einem wöchentlich gleitenden Ansatz. Der Stichtagswert wird mit 0,88 geschätzt. Damit folgt das RKI dem Modus, welcher meinerseits seit Anfang April präferiert und angewendet wird.

In diesem Beitrag skizziere ich die wichtigsten Unterschiede zwischen dem bisherigen und dem stabileren Schätzansatz.

Reproduktionszahl ist wichtiger Frühwarnindikator

Welche Bedeutung die Reproduktionszahl in der Steuerung der Covid-19-Pandemie hat, wurde zuletzt in den Pressekonferenzen der Bundeskanzlerin Angela Merkel deutlich. Ein nachhaltiger Wert über 1 würde bedeuten, dass das Gesundheitssystem früher oder später an seine Grenzen gerät.

Für mich persönlich war es von Beginn an die zentrale Steuerungsgröße: Die Reproduktionszahl setzt dort an, wo die Infektion stattfindet und damit auch die Ausbreitung des Coronavirus. Intensiv-Behandlung, andere medizinische Kapazitäten und Todesfälle stehen als Folgewirkung weiter hinten in der Kette. Um all dies brauchen wir uns wenige Sorgen machen, wenn wir die Ansteckungsraten gut quantifizieren und steuern können und vor allem veränderte Trends frühzeitig erkennen.

Auch wenn die Fallzahlen aktuell zurückgehen, ist es wichtig, dass die Kennzahl funktioniert, wenn sie funktionieren benötigt wird.

Die aktuellen Kennzahlen:

Berichtstag SchätzungReproduktionszahl Andreas Wenzel (7d)Reproduktionszahl RKI stabil (7d)Reproduktionszahl RKI sensitiv (4d)Reproduktionszahl TU Ilmenau (Punktschätzer)
27.05.20200,850,760,680,58
26.05.20200,830,780,700,89
25.05.20200,850,840,830,67
24.05.20200,850,930,941,21
23.05.20200,840,890,831,04
22.05.20200,840,910,870,72
21.05.20200,840,920,890,41
20.05.20200,830,870,880,61
19.05.20200,830,810,860,87
18.05.20200,830,820,910,96
17.05.20200,850,870,941,01
16.05.20200,860,890,880,91
15.05.20200,870,900,800,72
14.05.20200,870,880,750,37
13.05.20200,86-0,810,76
12.05.20200,84-0,941,07
11.05.20200,84-1,071,25
10.05.20200,83-1,131,18
09.05.20200,85-1,100,97
08.05.20200,80-0,830,59
07.05.20200,71-0,710,33
06.05.20200,70-0,650,47
05.05.20200,70-0,710,60
04.05.20200,650,760,91
03.05.20200,680,740,82
02.05.20200,750,780,76
01.05.20200,770,760,56
30.04.20200,750,760,32
29.04.20200,750,750,59
28.04.20200,750,900,83
27.04.20200,751,000,86
26.04.20200,800,900,98
25.04.20200,800,900,84
24.04.20200,800,900,64
23.04.20200,850,900,51

Immer wieder Ausreißer

Bislang hatte die vom RKI geschätzte Reproduktionszahl (Tabelle "RKI sensitiv") immer wieder für Verwirrungen in der Bevölkerung, der Presse und der Politik gesorgt. Während die Fallzahlen fast kontinuierlich sanken und seit Anfang April in kaum einem 4-Tages-Zeitraum höher waren als zuvor, wurden an zahlreichen Tagen Reproduktionszahlen auf und über 1 geschätzt. Das sorgt berechtigterweise für Zweifel, wenn Maßnahmen daraus abgeleitet und begründet werden sollen.

Bisheriges Vorgehen des RKI zur Berechnung der Reproduktionszahl.

"Der bisher berichtete sensitive R-Wert kann geschätzt werden durch Verwendung eines gleitenden 4-Tages-Mittels der durch das Nowcasting geschätzten Anzahl von Neuerkrankungen. Er vergleicht dann den 4-Tages-Mittelwert der Neuerkrankungen eines Tages mit dem entsprechenden Mittelwert 4 Tage davor. Die Infektionen der Neuerkrankungen liegen nochmal 4 bis 6 Tage davor, das heißt also sie fanden vor 8 bis 13 Tagen statt."

Täglicher Lagebericht des RKI zur Coronavirus-Krankheit-2019 (COVID-19) vom 14.05.2020

So wurde die Reproduktionszahl vom RKI bisher ermittelt: Sensitive Berechnung mit zwei 4-Tage-Zeitfenstern.

Dieses Vorgehen führte nach meinen Analysen dazu, dass

  1. der Anteil von modellierten Fällen im Rahmen der Hochrechnung (Nowcasting) sehr hoch ist;
    dadurch wurde die Reproduktionszahl mindestens genauso stark durch Prognosen wie durch echte Fälle geprägt,
  2. aufgrund der 4-Tage-Logik Schwankungen im Meldeverhalten infolge von Wochenenden und Feiertagen starke Auswirkungen auf Hochrechnungen hatten,
  3. in Zähler und Nenner miteinander nicht vergleichbare Zeiträume eingeflossen sind  (beispielweise Meldungen während der Osterfeiertage im Vergleich zur viertägigen Arbeitswoche zuvor mit entsprechendem Zeitversatz) und
  4. auch andere Schwankungen aus Nachverfolgungs- und Diagnoseaktivitäten zu deutlichen Schwankungen der Reproduktionszahl geführt haben.

Insgesamt ergab sich daraus, dass die ausgewiesene Reproduktionszahl auf 4-Tage-Basis wenig aussagefähig war und meiner Meinung nach auch weiterhin ist. Der hohe Einfluss von Nowcast-Fällen bedingt, dass es sich nicht nur um statistische Schwankungen um einen an sich treffenden Mittelwert handelt. Viel mehr fehlt dem Wert grundsätzlich ein hinreichend großer Anteil echter Fälle.

Nach meiner Einschätzung ist die sensitive R-Zahl unter Berücksichtigung der Diagnose- und Meldepraxis für eine Beurteilung des Infektionsgeschehens insgesamt nicht geeignet.

 

Ermittlung der stabilisierten Reproduktionszahl.

"Analog dazu wird das 7-Tage-R durch Verwendung eines gleitenden 7-Tages-Mittel der Nowcasting Kurve geschätzt. Schwankungen werden dadurch stärker ausgeglichen. Das 7 Tage-R vergleicht den den 7-Tages-Mittelwert der Neuerkrankungen eines Tages mit dem 7-Tages-Mittelwert 4 Tage zuvor. Die Infektionen der Neuerkrankungen liegen 4 bis 6 Tage davor, das heißt also sie fanden vor 8 bis 16 Tagen statt. Das 7-Tage-R bildet somit das Infektionsgeschehen vor etwa einer bis etwas mehr als zwei Wochen ab. Mit Datenstand 14.05.2020 0:00 Uhr wird der 7-Tage R-Wert auf 0,88 (95%-Prädiktionsintervall: 0,81 – 0,95) geschätzt.

Täglicher Lagebericht des RKI zur Coronavirus-Krankheit-2019 (COVID-19) vom 14.05.2020

So wird die stabilisierte Reproduktionszahl vom RKI seit 14. Mai ermittelt, was auch meiner Methode seit April entspricht: Verwendung von zwei überlappenden 7-Tage-Zeitfenstern.

Das bedeutet zunächst, dass die Schätzung der Reproduktionszahl im Zähler und Nenner um Erkrankungsfälle aus jeweils 3 früheren Tagen verlängert wird.

Damit wird bewirkt, dass

  1. der Anteil von Echtfällen in Zähler und Nenner steigt,
  2. besser vergleichbare Zeiträume (jeweils 7 volle Tage) in Zähler un Nenner einfließen, sodass in beiden jeder Wochentag einmal enthalten ist und
  3. sich aufgrund der insgesamt breiteren Datenbasis auch andere Effekte besser glätten und Verwerfungen mindern.

So ist die Reproduktionszahl in sich deutlich stabiler und vielfach besser geeignet, um ein insgesamt treffendes, nachvollziehbares und für Entscheidungen geeignetes Lagebild zu erzeugen. Zwar wird dadurch der Blick etwas weiter in die Vergangenheit gerichtet und ein um etwa zwei Tage weiter zurückliegendes Infektionsgeschehen beschrieben. Dieses ist jedoch deutlich aussagefähiger.

Das Backtesting für den April deutet auf bis zu dreifach geringere Schätzfehler hin: Covid-19 Reproduktionszahl: Schätzungen waren 3x so präzise wie RKI

Abgleich und Empfehlungen.

Insgesamt greift das RKI hiermit mein von April an verwendetes Vorgehensmodell auf. Bereits meine ersten Schätzungen auf Basis der Daten der Johns-Hopkins-University stellte auf um 4 Tage zeitversetzten wöchentliche Zeitfenster ab, woraus sich seither erheblich stabilere und aussagekräftigere Schätzungen zeigten.

Stabilisierungen ermöglichen es, das beobachtete Zeitfenster noch einen weiteren Tag an den Stichtag zu ziehen und eingebüßte Aktualität teilweise auszugleichen.

Durch die Verlängerung der Zeitfenster und der damit auch einhergehenden Stabilisierung des Nowcast selbst ist es nach meinen Erfahrungen durchaus angemessen, den bisher noch nicht verwendeten Zeitraum der jüngsten drei Tage um einen Tage zu verkürzen. Dieser lässt sich mit Hilfe von Nowcast-Daten recht treffend speisen, da selbige jetzt einer stabileren Schätzung unterliegen.

So könnte die gewonnene Stabilisierung, von den im Mittel etwa zwei bis drei verlorenen Tagen an Aktualität, einen zurückzugewinnen. Damit weisen beide Verfahren weisen dann sogar eine nahezu ähnliche Aktualität bei deutlich höherer Stabilität auf.

Auf den sensitiven R-Wert kann verzichtet werden.

Aus den geschilderten Gründen wäre es besser gewesen, die bisherige Reproduktionszahl vollständig durch den stabilisierten Wert zu ersetzen. Wie beschrieben erachte ich den senistiven Wert für nicht aussagefähig. Es habndelt sich eben nicht nur um statistische Schwankungen, sondern um eine für die Praxis ungeeignete Modellausgestaltung.

Ich freue mich!

...dass Deutschland nach aktuellem Dafürhalten und wochenlang immer wieder unplausiblen Schätzergebnissen nun endlich eine steuerungstaugliche Reproduktionszahl hat. Und ich hoffe, dass meine Arbeit etwas dazu beitragen konnte.

Die Zugriffzahlen auf meiner Webseite und der Mailverkehr sprechen rein statistisch dafür, dass sich mein Vorgehen zumindest in Fachkreisen herumgesprochen haben sollte. 😉

Statements von Followern:


10. Mai 2020 via Xing:

"Deine Berechnungen verfolge ich schon länger und finde sie ziemlich treffend. Sehr gut!"

Thomas Söhn, Consultant im Bereich Software-Validierung / Gründer von mydays
Starnberg


5. Mai 2020 via Facebook:

"Du bist einfach Hammer ! Respekt. Du schaffst, was ein Heer an Beamten nur mäßig hinkriegt, alleine."

Marc Frings, Geschäftsführer Hausverwaltung & Bauträger GEO Erfurt GmbH
Erfurt


5. Mai 2020 via Facebook:

"Wie kann es sein, dass ein Andreas Wenzel, so viel konkreter als ein Staat sein kann? Ja, am Anfang hast du drüber gelegen, doch mit Laufzeit näher dran als alle anderen."

Mike Borchert, Speaker & Coach, www.denkmanager.de 
Hannover

Andreas Wenzel Verfasst von:

Entwickelt und prüft als Consultant seit mehr als 15 Jahren Risikoquantifizierungs- und -steuerungsmodelle im bankaufsichtlichen Kontext.

Schreibe den ersten Kommentar

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.


Coronavirus: Reproduktionszahlen Bundesländer

täglich um 10:00 Uhr aktualisiert mit PDF-Download - eigene Modellschätzungen