Reproduktionszahl Deutschland

Die Reproduktionszahl für das Coronavirus und das Infektionsgeschehen in Deutschland wird meinerseits mit einem analytischen Ansatz täglich geschätzt und an dieser Stelle bereitgestellt.

Aktuelle Reproduktionszahl für Deutschland

Für die Ausbreitung des Coronavirus ergibt sich heute folgende Reproduktionszahl-Schätzung. (Fälle: Robert Koch-Institut 0:00 Uhr)

R (7d) 5% | 95%
1,17 1.04 | 1.30

Reproduktionszahlen im Zeitverlauf

aktuell geschätzte Entwicklung der Reproduktionszahl

Modellierung der epidemischen Kurve

(Eingangsdaten für das Modell: RKI)

Covid19: tägliche neue Fälle, 7d geglättet

Die Fallzahlen: Erläuterungen

Dieser Ansicht können Sie entnehmen, mit welchen Fallzahlen das Modell die Reproduktionszahl geschätzt hat.

Die Zahlen bestehen aus Fällen mit bekanntem Erkrankungsbeginn, solchen ohne bekanntem Erkrankungsbeginn ("Mapping" = modellseitig zugewiesener Erkrankungsbeginn) und Fällen aus der Hochrechnung für die jüngsten Tage (Nowcasting).

Zur Ermittlung der stabilen 7-Tage-Reproduktionszahl werden die Stichtagsdaten über 7 Tage nachlaufend gleitend geglättet.

7-Tage-Reproduktionszahl: Rückblick auf vergangene Schätzungen

die 30 jüngst vom Modell abgegebenen Verlaufsschätzungen

PDF zur Reproduktionszahl

Reproduktionszahlen im PDF-Bericht als Download

R-Indikatoren Bundesländer (PDF)

Tägliche vereinfacht geschätzte Reproduktionszahl-Indikatoren für die Bundesländer als PDF.

Reproduktionszahl Deutschland (PDF)

Täglicher Bericht zur Entwicklung der Reproduktionszahl in Deutschland als PDF-Download.

Methodische Hinweise

Allgemeine Anmerkung

Der gesamte Verlauf der Reproduktionszahl wird täglich neu geschätzt. Auch Reproduktionszahlen für frühere Stichtage unterliegen sich verändernden Einschätzungen, wenn wehr oder weniger Fälle verzeichnet werden als von Modell prognostiziert werden oder nachträglich Fälle bekannt werden. Insofern empfiehlt sich immer der Blick auf die gesamte Zeitreihe. 

Ansatz der Schätzung

Die Schätzung für Deutschland erfolgt im Erwartungswert (Nowcasting) mit einem analytischen Ansatz auf Basis des Erkrankungsbeginns. Die 7-Tage Reproduktionszahlen setzten die bekannten und geschätzten Erkrankungen der vergangenen 7 Tage ins Verhältnis zu einem ebenfalls 7-Tage-Zeitfenster vier Tage zuvor. 

Soweit für Fälle kein Erkrankungsbeginn bekannt ist, werden gemeldete Fälle entsprechend des aktuell typischen Zeitversatzes zwischen Erkrankungsbeginn und Meldestichtag auf mehrere Stützstellen verteilt ("Mapping"). Das Mapping erfolgt adaptiv auf Basis der Erfahrungswerte des jeweiligen Stichtags und der vergangenen sechs Tage.

Falldaten

Herangezogen werden automatisch bereitgestellte Meldedaten des Robert Koch-Instituts bis jeweils 0:00 Uhr. Die Reproduktionszahlschätzung bezieht Fälle mit Erkrankungsbeginn bis vier Tage vor dem Berichtsstichtag ein. Aus der gleitenden Ermittlung des 7-Tage-R ergibt sich für den mittleren Erkrankungsbeginn ein zusätzlicher Zeitversatz. Dieser wird aus Gründen der Vergleichbarkeit mit dem RKI-Modell mit einem Tag angenommen.

Nowcasting

Nowcasting-Fälle werden analytisch aus der jüngsten Vergangenheit unter Berücksichtigung des Niveaus der aktuellen Meldedaten und zugehöriger Erkrankungszeitpunkte als Erwartungswert geschätzt. Sich abzeichnende Veränderungen im Diagnose- und Meldeverhalten ("time lags") als auch Verschiebungen zwischen Fällen mit bekanntem Erkrankungsbeginn und solchen ohne bekannten Erkrankungsbeginn fließen hierbei ein. Das Nowcasting bedient sich einer vorauslaufenden indikativen Schätzung der effektiven Reproduktionszahl, welche auf die empirisch abgeleiteten Fälle zeitanteilig und unter Berücksichtigung der angenommenen mittleren Generationsdauer von 4 Tagen Anwendung findet. 

Prädiktionsintervall (5% - 95%)

Reproduktionszahlen verstehen sich als Schätzung eines mittleren Infektionsgeschehens. Daher unterliegen diese Schätzungen Unsicherheiten. Das bedeutet, dass sich die tatsächliche Reproduktionsrate in einer gewissen Streubreite um die vorgenommene Schätzung herum bewegen wird.

Das Prädiktionsintervall beschreibt den Bereich dieser Streubreite, welche nach Modellanschauung in nicht mehr als 5% der Fälle unterschritten und in 95% der Fälle nicht überschritten werden sollte. 

Je weiter ein betrachteter Stichtag in der Vergangenheit liegt und je vollständiger demzufolge der gesammelte Datenstand für diesen ist, umso präziser wird eine Schätzung ausfallen können.

Das angegebene Prädiktionsintervall wird aus empirischen Abweichungen zwischen ursprünglich geschätzten Nowcasting-Fällen zu später tatsächlich eingetretenen Fällen ermittelt. 

Validierung

Die Ergebnisvalidierung erfolgt fortlaufend durch Abgleich ursprünglich abgegebener Schätzungen mit der aktuellen Schätzung des R-Verlaufs. Weiterhin ex post wird ein Quervergleich der ursprünglichen Punktschätzer mit dem aktuell vom RKI geschätzten Verlauf der Reproduktionszahl vorgenommen.

Bislang zeichnet sich eine hohe Modellgüte ab, welche dem ausgewiesenen Prädiktionsintervall entspricht. Ursprünglich vom Modell abgegebene R-Schätzungen zeigen im Abgleich mit späteren Bewertungen weniger stark ausgeprägte Ausreißer als andere Nowcasting-Ansätze.  

Per 6. September wird im Ex-Post-Abgleich (7d R) eine Standardabweichung von 5,9% verzeichnet (ursprüngliche R-Schätzungen ./. aktuell geschätzter Verlauf). Für das RKI-Modell wurde ein Vergleichswert von etwa 8,8% beobachtet. (Stützzeitraum: Erkrankungsbeginn 08.06. - 25.08.2020; der 8.6. ist der Zeitpunkt der Überführung des Modells in die automatisierte Routine in der bis heute verwendeten Form)

Entsprechend wird meinerseits von einem etwa 35% geringeren Modellrauschen ausgegangen als im RKI-Modell. 

Hinweis zum 4-Tage-R

Zur Einschätzung des Infektionsgeschehens insgesamt wird meinerseits bereits seit Ende März ein 7-Tage-R präferiert. Das 4-Tage-R wird im obersten Diagramm lediglich als Zusatzinformation ausgewiesen. 

Alle Angaben ohne Gewähr.

15 Kommentare

  1. Georg Schober
    27. August 2020

    Sehr geehrter Herr Wenzel,

    vielen Dank für Ihre ausführliche Antwort.
    Da Sie meine Zweifel im Grunde bestätigen, aber doch die Aufbereitung der Rohdaten als im Wesentlichen O.K. einordnen, will ich versuchen einen Punkt nochmals herauszugreifen.
    Sie sagen:
    „Das liegt aber nicht an der Datenaufbereitung, sondern nach meiner Einschätzung tatsächlich am Wochenrhythmus der Arztbesuche im Hausarzt-Bereich.“ und
    „Tatsächlich hat es sich aber durch die Reiserückkehrer jetzt noch etwas verschoben, weil diese eben oft auch zum Wochenende getestet werden.“
    Nun, die Ursache für die Wochenrhythmik ist sicherlich klar, aber die Datenaufbereitung hat doch das Ziel eine ordentliche epidemische Kurve zu erhalten und genau das gelingt dem RKI offensichtlich nicht. Ohne eine epidemische Kurve, die dem tatsächlichen Geschen bei der Virusausbreitung möglichst nahe kommt, hat alle Berechnung von R oder Verdopplungszeit keinen Sinn.
    Auch die Reiserückkehrerproblematik und die lokalen Ausbruchsgeschehen verzerren die Fallzahlenkurve und erfordern eine Korrektur der Daten. Man hat mir das auch aus dem akademischen Bereich bestätigt, aber man warnt zugleich davor hier mit der Positivenrate zu arbeiten. Das Argument, das gegen die Positivenrate angeführt wird kann ich nachvollziehen, doch wo bleibt die alternative Lösung? Diese ist unverzichtbar bei der Art und Weise wie das RKI bei den Testungen vorgeht (Sie weisen selbst auf das neue aktuelle Reiserückkehrerproblem hin).
    Meine eigenen Bemühungen führten bisher immer dazu, dass mit der Positivenrate, trotz ihrer andersartigen Verzerrungen im zeitlichen Verlauf, ein wesentlich realistischeres Abbild des epidemischen Geschehens darstellbar ist als mit dem Resultat des RKI auf Basis der absoluten Fallzahlen. Dabei ist zu anmerken, dass die Positivenraten von RKI selbst ermittelt und immer Mittwochs zumindest als Grafik auch veröffentlicht werden. Auch das bayerische LGL teilt die Positivrate mit, nutzt diese aber ebenfalls nicht als epidemische Kurve. Kennen Sie den Grund warum sich diese Institute scheuen die Positiv(en)rate, also die relativen Fallzahlen als epidemische Kurve zu benutzen?
    Die geringere Genauigkeit bei der zeitlichen Zuordnung kann es kaum sein, da man ja nur den Wendepunkt und das Maximum des Verlaufs bestimmen will und der zeitliche Versatz von Probennahme- zu Infektionszeitpunkt nicht weniger streut als von z. T. fiktiven Erkrankungsbeginnen zu Infektionszeitpunkten.

    • Andreas Wenzel
      27. August 2020

      Sehr geehrter Herr Schober,

      bzgl. der Eignung der Positivrate hatte ich an anderer Stelle in den Kommentaren Ausführungen gemacht. Da die meisten Tests risikoorientiert und nicht nach dem Zufallsprinzip durchgeführt werden, sehe ich die Positivrate in keiner Weise als geeignet an, eine epidemische Kurve abzubilden. Wenn Sie gute Kriterien haben zur “Vorselektion” des Personenkreises, den Sie testen (Kontaktpersonen, symptomatische Fälle, Risikopersonen, Rückkehrer aus Risikogebieten etc.), wird die Positivrate immer recht gleich bleiben. Nur die Zahl der Personen, die sie testen ändert sich – je nachdem, wie groß die relevante Gruppe gerade ist. Wenn diese Kriterien gut gesetzt sind (und daran wird ja aktiv gearbeitet), können sie aus der Positivrate im Sinne einer Quote recht wenige Erkenntnisse ableiten. Da dürfen Sie dem gewählten Vorgehen aus meiner Sicht schon vertrauen.

      Zu den anderen Aspekten ist das eine Philosophiefrage: Ich komme selbst aus dem Risikomanagement und dort wird sehr ungern in Daten eingegriffen, vielmehr zählt das sogar als Tabu. Letztlich ist das die Aufgabe einer sachkundigen Beurteilung durch Experten, die Ergebnisse aus dem Modell dann möglichst treffend unter Würdigung von Veränderungen zu beurteilen. Diesbezüglich sehe ich es so, dass relativ kurzfristige Zeitfenster wie 11 Tage Stützzeitraum, welche für eine Reproduktionszahl relevant sind (7-Tage-Fenster und um 4 Tage rückwärts versetztes 7-Tage-Fenster) ein so kleiner Ausschnitt sind, dass ich dieses trotz Verschiebungen im Lang-Frist-Trend sehr gut nutzen kann. Die Ergebnisse sind auf jeden Fall so aussagekräftig, dass ich persönlich diese Information auf jeden Fall heranziehen und nicht darauf verzichten würde.

      Dass die Falldaten-Struktur im März bzgl. Falldefinition, Testing, Altersstruktur, Dunkelziffer etc. eine komplett andere war als jetzt: Ich glaube, darin sind sich alle seriös arbeitenden Experten einig und berücksichtigen das auch in der qualitativen Beurteilung, die sicher nicht Gegenstand der breiten medialen Diskussion ist. Aber alles, was ich bisher an Reaktion von offizieller Seite sehe, deutet darauf hin, dass diese Aspekte schon bedacht werden. Aber mit einem Eingriff in die Datenstruktur, welcher letztlich immer mit zusätzlichen Annahemen verbunden wäre, macht man es meistens weder besser, noch glaubwürdiger.

      Herzliche Grüße
      Andreas Wenzel

    • Andreas Wenzel
      27. August 2020

      p.s. Ich glaube, wir wissen alle, dass wir mit den Teststrategien und dem Testumfang von heute im März (wenn wir das damals schon so gehabt und praktiziert hätten) noch viel mehr Fälle gefunden hätten oder umgekehrt mit dem Vorgehen vom März heute nur einen Bruchteil der Fälle erkennen würden. Aber stellen Sie sich mal die öffentliche und auch die Experten-Diskussion vor, wenn da jetzt jemand anfangen würde, nach bestimmten Annahmen in den Falldaten-Verlauf einzugreifen und Zahlen anzupassen. Der Job von Experten ist es, die vorhandenen Informationen erstmal so zu nehmen, wie sie objektiv verfügbar sind, und dann im nächsten Schritt im Gesamtbild mit anderen Informationen eine Bewertung vorzunehmen. Dabei ist die Reproduktionszahl ein Puzzle-Teil.

      Nach meiner Einschätzung können wir da auch mal an einem einzelnen Stichtag durch derartige Trend-Verschiebungen 3% daneben liegen (da geht es auch nicht um Scheingenauigkeiten, ob es jetzt wirklich 1,10 oder doch 1,13 ist), sondern um das größere Bild. Und dafür taugen die Kennzahlen schon ganz gut, wenn man sich nicht an einem einzelnen Tag festklammert. Nach meiner Erfahrung wird es dann ab einem gewissen Punkt auch nicht mehr genauer, sondern nur komplizierter.

  2. Julia Müller
    27. August 2020

    Hi, danke für die schöne Seite, bin regelmäßig hier. Leider werden die Grafiken seit gestern auf meine Handy nicht angezeigt, nur zur Info! LG J Müller

    • Andreas Wenzel
      27. August 2020

      Sorry, gestern gab es ein paar Umstellungen. Das war mir gar nicht aufgefallen, da ich immer eingeloggt arbeite und da war alles noch da. 🙂 Es müsste alles wieder sichtbar sein.

  3. Georg Schober
    25. August 2020

    Die Reproduktionszahl, so wie sie vom RKI und auch von Ihnen ermittelt wird, spiegelt den Wochenrhythmus der Testhäufigkeit wider. Für mich ist das ein klares Indiz dafür, dass die zugrundeliegende Fallzahlenkurve (mit Imperien und Nowcasting) das Infektionsgeschehen nicht korrekt abbildet. Das Virus musste sich ja dann mit seiner Aktivität an den Wochenrhythmus halten. Daraus folgt, dass die so ermittelte Reproduktionszahl nicht korrekt sein kann, weil schon die Rohdatenaufbereitung unzureichend war. Wie sehen Sie das?

    • Andreas Wenzel
      25. August 2020

      Sehr geehrter Herr Schober,

      der Wochenrhythmus in der Testhäufigkeit, welcher sich hauptsächlich daraus ergibt, wann Menschen typischerweise zum Arzt gehen oder eben noch über das Wochenende abwarten, ist tatsächlich eine der großen Herausforderungen in der Reproduktionszahl-Schätzung. Das ist auch der Grund, weshalb ich von Beginn an auf über ganze Wochen geglättete Fallzahlen setze. Später hatte auch das RKI einen 7-Tage-R-Wert eingeführt. Auch in diesem gibt es noch leichte zyklische Schwankungen im Nowcasting, beim RKI etwas stärker als bei mir.

      Methodisch ist dem aber zu ergänzen, dass sich diese Schwankungen beim 7-Tage-R noch etwas herausglätten, wenn später mehr echte Fälle bekannt werden und der Nowcasting-Anteil geringer wird. Da wir nach Erkrankungsbeginn arbeiten und modellieren und nicht nach Test- oder Übermittlungsdatum, wird das 7-Tage-R dann schon stabil und auch aussagefähig. Deshalb kann ich nur empfehlen, nicht nur den einzelnen Tag zu betrachten, sondern trotzdem eher das Gesamtbild, welches Sie der interaktiven Grafik und auch dem tagesaktuellen PDF entnehmen können.

      Das liegt aber nicht an der Datenaufbereitung, sondern nach meiner Einschätzung tatsächlich am Wochenrhythmus der Arztbesuche im Hausarzt-Bereich. Aus Datensicht würde ich die Leute natürlich auch lieber zum Samstag oder Sonntag zum Arzt schicken, damit die Zeitreihen noch etwas stabiler sind 😉 Aber damit müssen wir Modellierer wohl leben. Tatsächlich hat es sich aber durch die Reiserückkehrer jetzt noch etwas verschoben, weil diese eben oft auch zum Wochenende getestet werden.

      Alles in allem glaube ich aber schon, dass Sie hier zumindest das Modell finden, was diese Schwankungen am besten im Griff hat. Ich gebe zumindest mein Bestes.

  4. schaumermaldann
    17. August 2020

    Wie wird das Prädiktionsintervall in Excel berechnet?

    • Andreas Wenzel
      17. August 2020

      Ich arbeite mit einer analytischen Software. Die Berechnung wäre aber genauso gut in Excel möglich. Hier in meiner Berechnung werden ursprüngliche Schätzungen des Nowcasting-Verlaufes vergangener Stichtage mit dann später verzeichneten Echtzahlen abgeglichen. Aus den Abweichungen ergibt sich eine empirische Verteilung, die Grundlage für die Schätzung des Konfidenzintervalls ist. Diese empirischen Abweichungen dienen dann als Grundlage der Ermittlung des Prätiktionsintervalls für aktuelle Schätzungen.

      • schaumermaldann
        17. August 2020

        Würden Sie mir verraten wie man das Prädiktionsintervall in Excel berechnet? Ich würde einfach nur gerne die Berechnung des RKI selbst nachvollziehen.

        • Andreas Wenzel
          17. August 2020

          Das RKI rechnet nach meinem Kenntnisstand in dem Bereich anders als ich. Dort wird alles aus Verteilungsfunktionen abgeleitet, die ich aber im Detail nicht offengelegt sind. Offengestanden bin ich aber kein Fan davon, da die Ergebnisse für meinen Geschmack zu volatil sind, was ja ein Grund dafür ist, dass ich eigene Analysen durchführe. Vielleicht publiziere ich bei Gelegenheit mal was dazu, bitte aber als Freiberufler auch um Verständnis, dass die Zeit für “Fachfragen nebenbei” etwas begrenzt ist. Im Grundsatz sind es einfache Analysen die die ursprünglich prognostizierten Nowcast-Fälle mit den dann “wirklich eingetretenen” (bekannt gewordenen) zusätzlichen Fällen vergleichen, über eine Quantil-Funktion die relative Streubreite bestimmen und das auf das aktuelle Nowcasting projizieren.

  5. schaumermaldann
    17. August 2020

    Müsste man nicht für eine seriöse Berechnung von R die Anzahl der positiv getesteten um die Anzahl der Tests bereinigen? Bei Ansonsten steigt bei steigenden Testzahlen das R genauso wie die Anzahl der positiv getesteten. Oder?

    • Andreas Wenzel
      17. August 2020

      Ich vermute schon, dass wir durch besseres Testing heute eine insgesamt deutlich geringere Dunkelziffer haben als beispielsweise im März und sich das Niveau der Fallzahlen dadurch im Zeitverlauf auch verschiebt. Das sieht man auch in der Falldaten-Zeitreihe im Verhältnis der grünen zur blauen Fläche. Diese Verschiebung findet aber schleichend statt, sodass die Auswirkungen dessen auf die Reproduktionszahl-Schätzungen einzelner Tage sehr gering sind.

      Darüber hinaus wäre Ihre Aussage zu den Testings dann zutreffend, wenn eine zufällig gewählte Stichprobe (“per Losverfahren” ausgewählte Personen) getestet und die Größe dieser zufälligen Stichprobe sukzessive erhöht werden würde. Die meisten Tests werden aber anhand risikobasiert festgelegter Kriterien (Kontaktnachverfolgung, Symptome, Reise in Risikogebiete etc.) ausgelöst.

      Daher ergibt sich die Größe der Stichprobe im Testing und auch deren Ausweitung alles andere als beliebig, sondern sogar sehr zielgerichtet. Aus dem Grund sind stochastisch andere Verfahren und Maßstäbe anzuwenden als bei einer rein zufallsbasierten Stichprobe. Aufgrund der gültigen Vorauswahl-Kriterien kann ich die landläufig gerne verbreitete Theorie, dass allein wir als Folge von mehr Tests auch mehr Fälle finden würden, fachlich nicht teilen. Vielmehr ist sogar das Gegenteil der Fall und die weitestgehend stabile Trefferquote spricht für die Qualität der Kriterien der definierten Vorauswahl. Eine leichte Unschärfe kommt zugegebenermaßen dadurch hinzu, dass Reiserückkehrer jetzt zunehmend auch freiwillig getestet werden können, wobei auch das noch immer ein risikobasiertes Vorauswahl-Kriterium ist.

      • schaumermaldann
        17. August 2020

        Dane. Ich bin in der Statistik-Denke nicht so drin. Meinen Sie mit “weitestgehend stabile Trefferquote” den Verlauf der Kurve für die Positivrate? Die ist ja viel flacher als die der “Neuinfektionen” (mir widerstrebt dieser Begriff, da ja keiner untersucht, ob die wirklich krank sind). Wenn ja würde das doch bedeuten, dass bei einer “schlechteren” also zufälligen Stichprobe, die Positivrate noch flacher wäre. Wenn es darum geht, die Verbreitung der Pandemie in der breiten Bevölkerung zu beurteilen und z.B. die Notwendigkeit eine weiteren Lockdown zu beurteilen, sollte man doch die Reiserückkehrer aus Risikogebieten u.ä. außen vor lassen, denn die erwischt man ja durch die zielgerichteten Tests.

        • Andreas Wenzel
          17. August 2020

          Genau, bei einer beliebig ausgewählten Stichprobe würde ich mit einer geringeren Trefferquote als 1% aktuell rechnen. Bei den Reiserückkehrern ist es ja genau das Ziel, diese zu erwischen. Von daher sind steigende “gefundene” Fallzahlen auch nicht schlecht, wenn dadurch Folgeinfektionen vermieden werden können. Das werden die Verantwortlichen sicher auf dem Schirm haben, dass es sich hier oft um eingetragene Fälle handelt und nicht immer um Ansteckungen in Deutschland.

Die Kommentare sind geschlossen, aber Trackbacksund Pingbacks sind erlaubt.