Warum die Reproduktionszahl des RKI steigt und wie hoch sie wirklich ist.

Samstag meldete das Robert Koch-Institut für Covid-19 eine Reproduktionszahl von 1,1, Sonntag waren es 1,13, am Montag 1,07. Schock-Meldungen zur exponentiellen Ansteckungsrate gehen durch die Presse, Diskussionen ziehen sich durch sie Sozialen Medien. Schließlich hatte Angela Merkel noch vor wenigen Wochen in ihrer Pressekonferenz skizziert, was es bedeuten würde, wenn die Zahl auf 1,1 oder sogar 1,2 steigt.

  • Ist der Sommerurlaub etwa in Gefahr?
  • Oder ist die Reproduktionszahl falsch berechnet?
  • Manipuliert da jemand?
  • Sind das intensivere Testing oder die Dunkelziffer etwa Übeltäter von steigenden Ansteckungsraten?

Genau auf diese Fragen möchte ich hier kurz eingehen.

Wie wird die effektive Reproduktionszahl berechnet.

Zunächst: "Berechnung" ist wirklich das falsche Wort. Die Reproduktionszahl entspringt einem Modell und Modelle dienen der Abbildung der Wirklichkeit unter Berücksichtigung der bekannten Informationen und Annahmen zu den Einflüssen, welche wir nicht oder nur bruchstückhaft kennen. Deshalb ist "Schätzung" treffender als "Berechnung".

Modellannahmen sind die Gründe, weshalb die Reproduktionszahl steigt.

Doch von vorn: Wollen anhand der bekannten Fallzahlen wir die Ansteckungsrate wissen, also die Zahl der Personen, welche ein Infizierter ansteckt, so müssen wir wissen, wie lange er überhaupt als ansteckend gilt und wann er im Schnitt eine oder mehrere weitere Personen infiziert.

Die Generationsdauer: 4 Tage

Hier geht das Robert Koch-Institut davon aus, dass ein Infizierter etwas 8 Tage lang infektiös ist und damit im Mittel nach dem vierten Tag weitere Personen anstecken würde. Zur Berechnung oder Schätzung der jüngsten Reproduktionszahl müssten wir also die Zahl derer, die sich heute infizieren mit der Zahl der Personen vergleichen, welche sich vier Tage zuvor infiziert haben.

Die Inkubationszeit.

In der Realität dauert es natürlich noch einige Tage, bis eine Person überhaupt ansteckend ist. Dieser Dauer unterliegt aber sowohl der Infizierte als auch derjenige, welcher infiziert wird. In der Berchnungslogik lässt sich die Inkubationszeit also kürzen und vernachlässigen. Dennoch bedeutet sie natürlich, dass beobachtete Kennzahlen in Wahrheit noch einige Tage weiter zurückliegt als wir es bemessen können.

Die Reproduktionszahl beschreibt die Anzahl der neu Infizierten Personen in Relation zu den Neuinfektionen vier Tage zuvor und ist daher in der Theorie ein einfacher Bruch, mehr nicht.

Der Erkrankungsbeginn

Für den Stochastiker schwierig wird es dadurch, dass Infektionen regelmäßig erst zum Zeitpunkt des Auftretens von Symptomen (Erkrankungsbeginn) erkannt und diagnostiziert werden können. Daher nutzt das Robert Koch-Institut (und auch ich) ersatzweise den Erkrankungsbeginn anstelle des echten Infektionszeitpunktes.

Der  imputierte Erkrankungsbeginn

Covid-19 unterliegt nun der Besonderheit, dass die Mehrzahl der Infizierten keine oder nur sehr leicht Symptome aufweisen. Für diejenigen, die gar keine Symptome haben und einzig aufgrund der Nachverfolgung und des Testings diagnostiziert werden, gibt es bei diesen Fällen keinen echten Erkrankungsbeginn. Im Modell zur Schätzung der Reproduktionszahl wird daher ein theoretischer Erkrankungsbeginn modelliert und verwendet. Das Datum nennt das RKI den imputierten Erkrankungsbeginn. Dieser wird anhand von Erfahrungswerten aus dem Personenkreis geschätzt, die echte Symptome aufweisen.

Aktuell ist für etwa 2/3 der Fälle ein plausibler Erkrankungsbeginn vorhanden. Für etwa 1/3 der Fälle wird ein Datum modelliert.

Das Meldedatum

In der großen Mehrheit der Fälle liegen jedoch auch zwischen Erkrankungsbeginn, labordiagnostischer Untersuchung und der Meldung über Landesämter bis zum RKI noch einige Tage. Erfahrungsgemäß sind es im Mittel etwa sechs bis sieben Tage. Es gibt aber auch Fälle, bei welchen die Diagnose und Meldung erst deutlich später stattfindet, und ebenso gibt es Fälle, wo Covid-19 diagnostiziert wird, bevor überhaupt die ersten Symptome auftreten.

Zum jeweiligen Meldestichtag ist die Datenbasis daher noch lange nicht vollzählig, denn es gibt eine unbekannte Anzahl von Personen, die gerade erst erkrankt ist, noch diagnostisch untersucht werden muss und erst später gemeldet werden wird.

Wir wissen also in den Stichtagsdaten nicht präzise, wie viele Erkrankte es aktuell gibt. Diese Zahl kann nur aus der Vergangenheit auf das aktuelle Datum "hochgerechnet" werden.

Dabei behilft sich das RKI-Modell zweier Lösungsansätze:

Schätzung bis drei Tage vor Meldedatum.

Für die jüngsten drei Tage sind bislang nur die wenigsten Fälle mit Erkrankungsbeginn in diesen Tagen wirklich bekannt. Die meisten neugemeldeten Fälle haben ihren Erkrankungsbeginn deutlich früher. Daher werden diese Tage in der Schätzung ausgeblendet. Meldungen aus diesen drei Tagen werden nur genutzt, soweit der Erkrankungsbeginn weiter als drei Tage zurückliegt, was auch weit mehrheitlich so ist.

Nowcast

Doch auch für den um drei Tage zurückliegenden Stichtag sind noch lange nicht alle Fälle bekannt, denen ein Erkrankungsbeginn für diesen Tag zuzurechnen ist.

Für den Stichtagsschätzer (drei Tage zurück) sind erfahrungsgemäß erst etwa 35% bis 45% der Fälle mit Erkrankungsbeginn bis zu diesem Tag bekannt.

Konkret bedeutet das: In die Stichtagsschätzung der Reproduktionszahl fließen etwa 40% echte diagnostizierte Fälle ein und etwa 60% modellbasiert hochgerechnete Fälle.

Dieses Verhältnis kann jedoch von Tag zu Tag deutlich schwanken.

Wochenenden, Feiertage und Arbeitstage

Für den Analytiker wäre es nun optimal, wenn sich Infizierte, Ärzte, Labore und Gesundheitsämter 24 Stunden am Tag und sieben Tage die Woche einheitlich verhalten würden.

Wer Symptome hat, geht gleich zum Arzt, dieser nimmt sofort eine Probe, das Labor diagnostiziert umgehend und das Ergebnis wird - sofern positiv - umgehend gemeldet.

Die Praxis ist jedoch eine andere: Sowohl Patienten als auch Ärzte und Labore verhalten sich nicht wie sich das Modell das wünschen würde.

Das ist auch gut und menschlich so. Es zeigt jedoch, dass das idealtypische Modell des RKI in der Praxis an Grenzen stößt. Ich möchte es kurz in einer Chronologie aufzeigen.

 

Die Chronologie der Reproduktionszahl.

Darstellung Reproduktionszahl RKI
Warum die Reproduktionszahl steigt: Zusammenhänge im Modell.

Vor Ostern (bis 9. April).

Anfang April war die liebe Nachverfolgung an ihre Grenzen geraten. Dies sorgte dafür, dass zahlreiche Fälle erst später erkannt worden. Aus der Dunkelziffer heraus werden diese und viel mehr einige Folgeinfektionen erkannt, diagnostiziert und fließen in die Reproduktionszahl ein. Die Dunkelziffer sinkt (vermutlich).

Auf Basis der nun identifizierten Fälle erfolgt eine Hochrechnung mittels Nowcast anhand historisch ermittelter Quoten. Die Reproduktionszahl steigt mit entsprechendem Zeitversatz von 3 Tagen um Ostern auf einen Wert bis 1,3.

Um Ostern

Wir haben nun wieder eine höhere Transparenz über existente Fälle. Relativ zu den vor Ostern identifizierten Fallzahlen normalisiert sich das Bild. Doch gleichzeitig werden einige neu Infizierte mit Symptomen über Ostern doch vielleicht bis Dienstag oder Mittwoch nach Ostern gewartet haben, bis sie beim Arzt vorstellig wurden. Labordiagnosen dauern noch einen Tag, Meldungen ebenfalls.

Über Ostern und kurz danach sinken die gemeldeten und im Zeitversatz berücksichtigten Fallzahlen. Am 17. April liegt die Reproduktionszahl des RKI bei 0,7.

Es ist nichts anderes als die Gegenbewegung zur Woche davor und das übliche "Feiertagsverhalten".

Da das Nowcasting weitestgehend mit stabilen Verhältnissen zwischen berichteten und noch zu erwartenden Nachmeldungen rechnet, geraten die Verhältnisse bei deutlich abweichendem Diagnose- und Meldeverhalten aus den Fugen.

In der Modelltheorie sollte dies zwar durch Berücksichtigung des Erkrankungsbeginns ausgeglichen werden. In der Praxis sind unterschiedlich zügige Meldungen dennoch ein erheblicher Einflussfaktor für den jeweiligen Stichtag.

1. Mai 2020

Ein ähnlicher Effekt war auch in Folge des verlängerten 1.-Mai-Wochenendes zu beobachten: Deutlicher Rückgang der Reproduktionszahl zwischen 5. und 7. Mai bis auf 0,65 anschließende Korrekturbewegung vom 9. bis 11. Mai bis auf 1,13.

Bedenkt man nun, dass das Modell in 4-Tage-Generationsdauern analysiert, wird der Zusammenhang klar. Die Wahrheit liegt wohl in etwa in der Mitte,

Doch ganz genau lassen sich die beiden Reproduktionszahlen selbst nicht gegeneinander aufwiegen, da sie sich immer auf absolute Werte beziehen. Eine "Gegenrechnung" dieser Effekte müsste daher gewichtet erfolgen.

Schwankungen sind modellgetrieben.

Führen wir uns nochmal vor Augen, dass etwa 60% der Fälle, welche eine Reproduktionszahl beeinflussen, modellbasiert ermittelt werden auf Basis der Daten, die bislang gemeldet wurden:

Das Nowcasting führt im Moment dazu, dass sich zyklische Effekte verstärken: Egal, ob Feiertage, Wochenenden oder eine an Grenzen geratende Nachvervolgung die Ursache ist.

Im Idealfall sollte ein Modell derartige Sondereffekte heraus glätten und kompensieren. Das RKI-Schätzverfahren bewirkt im Moment aber genau das Gegenteil: Anomalien werden verstärkt.

Das Modell erzeugt über das Nowcasting aktuell Reproduktionszahlen, welche realistisch gesehen seit Anfang April nicht stattgefunden haben: Das betrifft sowohl Werte unter 0,70, aber noch mehr betrifft es Werte über 1,0.

Das Einzige was wir im Moment erkennen: Es geht schneller: Während sich selbstverstärkende Effekte nach Ostern noch einige Tage mehr hingezogen haben, sehen wir sie jetzt recht schnell.

Dies könnte auch an den sich verkürzenden Diagnose- und Meldedauern liegen, welche einerseits im Modell als Parameter Einfluss finden, aber auch ganz praktisch zu beobachten sind. Auch einzele Ausbruchsgeschehen werden ihren Beitrag geleistet haben.

Beides zeigt aber einmal mehr, dass der Versuch, aus wenigen Stichtagen ein Lagebild abzuleiten eher zu Irritationen führt, als dass große Trends in der Breite wirklich abgebildet werden können.

Im Prinzip sehen wir den Wald vor lauter Bäumen nicht. Wir sind geblendet von Einzel-Ereignissen, die auch in der Reproduktionszahl das viel bedeutsamere große Bild überlagern.

Wo liegt die Reproduktionszahl wirklich.

In meinem Modell erzeuge ich etwas stärker geglättete Werte. Wenn wir uns vor Augen halten, wie lange es dauert, bis Effekte aus Maßnahmen wie Kontaktbeschränkungen, Schulschließungen und so weiter wirken, ist das wohl auch der treffendere Ansatz, um ein "Big Picture" zu erhalten.

Covid-19 Reproduktionszahl aktuell
aktuelle Ansteckungsrate Coronavirus auf Basis Falldaten RKI

In meinen rückwärtigen Schätzungen hat die Reproduktionszahl seit Ostern, also etwa seit einem Monat, den Korridor zwischen 0,80 und 0,90 nicht wirklich verlassen. Alles andere sind Sondereinflüsse aus dem Modell, aus Feiertagen und aus der Nachverfolgung.

Noch ein Wort zum erweiterten Testing: Ich persönlich halte den Einfluss auf die Reproduktionszahl für gering: Es sind einige "Nadeln im Heuhaufen" die noch gefunden werden können. Doch das kann einen Modellwert wie die Reproduktionszahl definitiv nicht "mal schnell" von 0,65 auf 1,13 anschnellen lassen. Zudem wird es wohl auch noch einige Tage dauern, dass das am 6. Mai ausgeweitete Testing wirklich in den Fallzahlen repräsentativ zum Ausdruck kommen kann.

 

Andreas Wenzel Verfasst von:

Entwickelt und prüft als Consultant seit mehr als 15 Jahren Risikoquantifizierungs- und -steuerungsmodelle im bankaufsichtlichen Kontext.

2 Kommentare

  1. Jörg Voelker
    14. Mai 2020

    Danke Herr Wenzel für Ihre Top-Arbeit, endlich kann ich die RKI-Werte Mal richtig einordnen. Das war mir – ohne ihre Erklärung – bisher nicht möglich. Scheinbar hat das RKI jetzt auch erkannt, dass dieser bisherige R-Wert durch diese Schwankungen eher unnötige Unruhe stiftet, als einen wirklichen Nutzen. Kompliment, da waren Sie mit Ihrer Berechnung dem RKI einen gehörigen Schritt voraus.

    Mit freundlichen Grüßen
    Jörg Voelker

    • Andreas Wenzel
      24. Mai 2020

      Vielen Dank für Ihre Rückmeldung. Ich übe noch mit den Kommentaren hier. 🙂

Die Kommentare sind geschlossen


Coronavirus: Reproduktionszahlen Bundesländer

täglich um 10:00 Uhr aktualisiert mit PDF-Download - eigene Modellschätzungen