Reproduktionszahl: Fehler und Irrwege in den Einschätzungen?

Last updated on 23. April 2020

Groß und schmerzhaft sind die Einschnitte des Lockdowns im Rahmen der Covid-19-Pandemie: Ein Fehler? Nach der Veröffentlichung der Reproduktionszahl durch das Robert Koch-Institut (RKI) mehren sich die Diskussionen um einen Wert, welcher bereits zum Zeitpunkt des Lockdowns unter eins gelegen haben soll. Das würde bedeuten, dass schon Mitte Märt keine exponentielle Ausbreitung mehr stattgefunden hätte. So weist es das Epidemiologische Bulletin des RKI aus. Und rechnerisch stimmt dies auch.

Heiß diskutierte Reproduktionszahl: Lagen wir zum Lockdown wirklich unter R=1? (Abbildung RKI: an der Heiden M, Hamouda O: Schätzung der aktuellen Entwicklung der SARS-CoV-2-Epidemie in Deutschland – Nowcasting.)

Doch wir könnten auch völlig falsch liegen in der Bewertung dieser Kennzahl, welche nun die neue Orientierung geben soll. Vor allem die Interpretation deren Veränderung soll Aufschluss darüber geben, welche Maßnahmen welche Wirkungen erzielen und und somit zur Eindämmung des Virus beitragen können. In diesem Beitrag möchte ich zwei mögliche Irrtümer, blinde Flecken und relevante Wirkungszusammenhänge skizzieren, welche uns genau dabei etwas aufs Glatteis führen könnten.

Haben die Kontaktbeschränkungen so wenig bewirkt?

Schnell wird Schweden herbeizitiert und als Beispiel genutzt, dass auch weniger Maßnahmen im Umgang mit dem Coronavirus mehr oder zumindest vergleichbar gut sein könnten. Womöglich. Doch nach genaueren Analysen der deutschen Zahlen scheint etwas Zurückhaltung und auch kritische Auseinandersetzung angebracht.

Es gibt da einige Effekte in der Entwicklung der Covid-19- Fallzahlen, welche durchaus trügerisch sein könnten.

Bevor ich detaillierter darauf eingehe, möchte ich betonen, dass zahlreiche der nachfolgen Betrachtungen beispielhaft  zu verstehen sind. Betrachten Sie es bitte als Was-wäre-wenn-Analyse. Verstehen Sie es als eine analytische Diskussion von Hypothesen, welche keineswegs den Anspruch auf abschließende Einschätzungen hat, aber durchaus zusätzliche Perspektive auf unsere Daten und deren Interpretation eröffnen kann.


Bias 1: Schwankende Dunkelziffer aufgrund begrenzter Laborkapazitäten.

Unbestritten dürfte sein, dass die Testkapazitäten Mitte März an ihre Grenzen geraten waren. Das RKI hat einerseits mit einer erweiterten Falldefinition logisch reagiert. Andererseits wurden Laborkapazitäten systematisch erweitert.

Ein Blick auf die von mir nachgestellten Reproduktions- und Fallzahlen:

Reproduktionszahl auf 1
Fallzahlen für Neuinfektionen schon seit 15. März wie gedeckelt.

Wie gedeckelt erscheinen die Fallzahlen mit Erkrankungsbeginn ab 15. März 2020. Das war kurz vor der Änderung der Falldefinition. Wirklich kein weiterer Anstieg bis zum 23 März? Genau in diesen Kalenderwochen 13 und 14 wurden jedoch die bis dahin meisten Tests registriert und auch die höchste Quote positiver Ergebnisse, so Statista. Bei der Interpretation dieser Daten ist zu bedenken, dass die Diagnose und Übermittlung der Covid-19-Daten an das RKI natürlich in den meisten Fällen nach dem Eintritt von Symptomen, also nach Erkrankungsbeginn erfolgen.

Konkret bedeutet das: In der zweiten Märzhälfte wurden üblicherweise Fälle gemeldet, welchen überwiegend ein Erkrankungsbeginn Mitte März zuzurechnen ist. Gleichzeitig berichtet das RKI im oben verlinkten Bulletin für die Tage um den 30. März den größten Zeitversatz zwischen Erkrankungsbeginn und Übermittlung. Kurzum: Die Tests haben länger gedauert als sonst. Voll ausgelastete Labore in diesen Tagen sind wohl die nahe liegende Erklärung hierfür. Natürlich wissen das auch Ärzte, wenn sie darüber nachdenken, ob sie Verdachtsfälle testen lassen oder die Wahrscheinlichkeit doch so gering ist, dass sie es in Anbetracht der knappen Kapazitäten lieber lassen.

Anstieg der Quote positiver Testungen

Nehmen wir an, einige Verdachtsfälle ohne Symptome wären genau deshalb im Zeitraum vor dem 23. März ungetestet geblieben. Die Kapazitäten wurden zunehmend auf Fälle mit echten Symptomen verwendet. Die höhere Quote positiver Testungen deutet in diese Richtung.

In der Politik wurden in den vergangenen Tagen darüber hinaus Zielsetzungen postuliert, in den Gesundheitsämtern größere Kapazitäten zur Nachverfolgung einzurichten. Das Ärzteblatt prognostizierte bereits in einem Beitrag vom 3. März hin: "COVID-19: Nachverfolgung der Kontakte könnte bald an Grenzen stoßen" und beschrieb das aufwändige Procedere.

Nehmen wir daher zusätzlich an, dass die Anfang März noch akribische Nachverfolgung von Infektionsketten ebenfalls an Grenzen gestoßen ist. Auch das ist bei teilweise 5.000 Fällen am Tag fast offenkundig.

So viel kann als wahrscheinlich gelten: In der relativen Sicht wurden weniger Verdachtsfälle getestet. Damit konnten auch einige positive Fälle ohne Symptome nicht mehr indiziert werden, welche einige Wochen zuvor noch aufgefallen wären. Diesen Teil sogenannter asymptomatischer Fälle konnte, soweit nicht getestet, auch die neue Falldefinition nicht erfassen.

Die Dunkelziffer dürfte in diesem Zeitraum gestiegen sein.

Mir liegt jedoch als Zwischenbemerkung am Herzen: Auch die besten Laborkapazitäten der Welt und intensivste Nachverfolgung haben Grenzen. Was vorher die Stärke war, führt - sobald das System seinen Anschlag erreicht - zum Bruch in der Zeitreihe. Diese Brüche sind gänzlich vorwurfsfrei als Zwangsläufigkeit anzunehmen. Doch für statistische Aussagen sind derartige Änderungen Gift. Das sollten wissen und bedenken, wenn wir Daten und Kennzahlen interpretieren und Maßnahmen ableiten möchten.

In diesem Fall bedeutet das: Die Dunkelziffer steigt sehr wahrscheinlich. Wer relativ gesehen weniger testet (was in unserem Fall im internationalen Vergleich noch immer viel ist), bekommt auch weniger Ergebnisse.

Diese tiefer gehende Interpretation kommt mir persönlich in der öffentlichen Fachdiskussion hin und wieder etwas zu kurz.

Bei der wachsenden Dunkelziffer infolge limitierter Möglichkeiten reden wir in meinem Bilde auch nicht von einigen Einzelfällen. Die sich ändernden Quoten positiver Testings deuten darauf hin, dass wir uns sehr wahrscheinlich in einem Bereich mittlerer zweistelliger Prozentsätze bewegen dürften.

Lag der Anteil positiver Testungen im KW 11 noch bei 6%, waren Ende März 9% zu verzeichnen. Relativ ist das ein Anstieg um 50% in der "Trefferquote". Bei täglich tausenden Testungen in ganz Deutschland ist eine derartige Größe kein Zufallsergebnis. Betrachten wir es als Indiz, dass deutlich selektiver getestet wurde als noch kurze Zeit zuvor.

Solange die Dunkelziffer stabil bliebe, ist die ermittelte Reproduktionszahl als repräsentative Stichprobe geeignet. Da dies wahrscheinlich nicht gegeben war, könnte das anzunehmende Gap durch eine entsprechende Korrekturgröße aufgefüllt werden.

Mögliche Fehler ausgleichen: Ergänzung hypothetischer Fälle

Im Sinne einer Was-Wäre-Wenn-Betrachtung habe ich ausgleichend eine deutliche Zahl hypothetischer Fälle zwischen Mitte März und Anfang April in die Modellierung aufgenommen. Auf den ersten Blick mag die Anzahl vermessen wirken. Wir dürfen aber nicht ganz vergessen, dass die Dunkelziffer nach aktuellen Vermutungen ohnehin hoch ist. Wir sehen also nur "die Spitze des Eisbergs. Was wir sehen, ist also ohnehin nur ein kleiner Ausschnitt der Wirklichkeit.

Die abgebildete Korrekturgröße ("Testing Gap") ist deshalb vielleicht gar nicht so weit hergeholt.

Reproduktionszahl mit hypothetischer Schwankungskorrektur
Neuerkrankungen mit Korrekturgröße für schwankende Dunkelziffer.

Ich habe die Kurve nun so modelliert, wie ich sie mir etwa vorstellen würde. Es ist eine Annahme unter den geschilderten Abwägungen. In Fachkreisen würde man das als "Expertenschätzung" bezeichnen. Wichtig ist: Es soll nicht die gesamte Dunkelziffer abgebildet werden, sondern nur der Bereich, in welchem diese variiert haben könnte. Um in der Metapher zu bleiben: Es geht nur um den Teil, um welchen der Eisberg zwischendurch abgetaucht und später wieder aufgetaucht sein könnte. Als die Fallzahlen wieder abgenommen haben und die Laborkapazitäten ausgebaut wurden, hat sich der Zustand wieder etwas ausgeglichen.

Reproduktionszahl sinkt langsamer

Wir sehen nun einen visuell ergänzten Verlauf von Neuerkrankungen, welcher letztlich dazu führt, dass sich auch der Rückgang der Reproduktionszahl deutlich bis Ende März streckt.

Die Reproduktionszahl ergibt sich in der Schätzung immer aus einem Vergleich von Neuinfektionen zu denen um eine mittlere Generationsdauer später. Das sind bei Covid 19 im Mittel vier Tage, was bedeutet: Es wird angenommen, dass ein Infizierter etwa 8 Tage lang ansteckend ist und im Mittel am vierten Tag eine bestimmte Anzahl weiterer Personen infiziert. Die Reproduktionszahl besagt, wie viele es sind durchschnittlich je infizierter Person sind.

Um mögliche Schwankungen von Tag zu Tag zu glätten, wird einerseits ein 4-Tages Zeitraum mit einem um 4 Zage versetzten Zeitraum verglichen. In meiner Abbildung beziehe ich mich darüber hinaus auf ein 7-Tage-Zeitfenster, welches ebenfalls mit dem um vier Tage vorwärts versetzten Zeitraum verglichen wird. Dies erklärt auch, weshalb wir die aktuelle Reproduktionszahl immer erst später bemessen können.

(Anmerkung: An anderen Stellen / anderen Beiträgen habe ich vereinfachend mit rückwärts versetzten Zeitfenstern gearbeitet, was schlichtweg den Grund hat, dass ich gerne mit etwas über einen Zeitraum geglätteten Werten arbeite, wodurch es ohnehin schwierig wird, den Wert einem spezifischen Zeitpunkt zuzuschreiben.)

Diese 7-Tage-Betrachtung (Generationsdauer dennoch 4 Tage) stabilisiert den Wert etwas stärker, was ich bevorzuge. Darüber hinaus sind Fälle für einen sogenannten Nowcast modelliert. Dieser korrigiert Erkrankungsfälle, welche eventuell erst später erkannt, aber der aktuellen Zeitreihe zuzuschreiben sind. Ich bin hier im Vergleich zum RKI etwas vereinfacht vorgegangen. Ergebnisse und Tendenzaussagen sind jedoch recht nah an den RKI-Werten.

Durch die höheren Bezugsgrößen an Neuinfektionen in den Vorwochen stellt sich auch im April die Reproduktionszahl mit 0,75 etwas niedriger dar als in der obigen Abbildung mit 0,85. Es gibt nicht wirklich absolut weniger Neuinfektionen, aber relativ als für vier Tagen zuvor angenommen wird. Für die Momentaufnahme ergibt sich also kein komplett gegensätzliches Bild, aber ein anderer Trend.

Wenn die hier getroffenen Annahmen nur annähernd der Realität entsprächen, so hätten die Lockdown-Maßnahmen doch eine höhere Wirkung erzielt als wir auf Basis der objektiv vorliegenden Fallzahlen bemessen würden.

Mehr als ein Zünglein an der Waage.

Im Szenario wäre es ein Rückgang um etwa 0,25 seit dem Lockdown, wobei bereits vorher zahlreiche Maßnahmen (besonders in betroffenen Bundesländern) eingeleitet waren. Als zusätzliche erzielte Wirkung wäre das bereits eine recht bedeutsame Größe. Den Unterschied zwischen einem spürbar exponentiellen Anstieg oder einem leichten Rückgang kann sie ohne Zweifel bewirken.

Schon dieses Beispiel zeigt, wie komplex es aktuell ist, die Wirkungen der Maßnahmen überhaupt zu bewerten - geschweige denn, einzelne Einflüsse voneinander abzugrenzen. Unfreiwillige Systembrüche machen uns offenbar einen gewaltigen Strich durch die Rechnung.


Bias 2: Der Ischgl-Event-Import.

Eine Reproduktionszahl soll beschreiben, wie sich ein Virus üblicherweise ausbreitet oder sich auch andere Zellen in der Natur reproduzieren. Doch auch hier sieht die Realität etwas anders aus als wir uns das in einer schönen Modell-Welt gerne vorstellen würden. Faktisch haben wir es aus Sicht eines Risiko-Analysten wohl eher mit der Kategorie der Event-Risiken zu tun, welche das Geschehen prägen. Das dürfen Sie in dem Fall doppeldeutig verstehen.

In wohl nicht ganz unerheblichem Maße ist Covid-19 erst per Flugzeug und später dann mit scharenweise zurückkehrenden Ski-Urlaubern per Auto oder Bahn sehr plötzlich bei uns gewesen. Diese Form des Imports wäre dann das wahre "Event" in unserer Zeitreihe.

Einige  Quellen deuten für die nordischen Länder auf Quoten im Bereich von 30 bis 50% an Fällen in den ersten März-Wochen, welche direkt auf diese Ski-Urlauber zurückzuführen gewesen seien. Auch in Deutschland gibt es bereits einige hundert Personen, welche Klage gegen den österreichischen Skiort Ischgl erheben wollen. Echte nach Deutschland eingetragene Fälle sind es wohl vielfach mehr,

Bis zu 50% direkt importierte Fälle aus Österreich schätzten nordische Länder.

Corona ist also viel mehr plötzlich mit dem Auto angekommen als es dem Modell der Reproduktionszahl (R) entsprechen würde. "R" möchte viel lieber natürliche Wachstumsprozesse erfassen. Dafür, dass Viren per Flugzeug, Schiff oder Auto als "Sammellieferung" ankommen, ist "R" nicht so richtig vorgesehen. Und das macht es der Reproduktionszahl etwas schwer, für diesen Zeitraum im März eine Ausbreitungsgeschwindigkeit zu bemessen.

"R" kennt keine Grenzen.

Wären alle Fälle "über Nacht eingetroffen", würde R schlichtweg gegen unendlich tendieren, wenn wir es für eine ausgewählte Region wie Deutschland bemessen wollten. Und da ist auch schon die zweite Annahme: "R" interessiert sich einfach nicht dafür, dass wir auf der Landkarte ein paar Grenzen festgelegt haben und innerhalb dieser Reproduktionszahlen ermitteln wollen. Corona auch nicht.

Mir ist dieses Phänomen aufgefallen, als ich mich im Nachgang einer Beratung mit den Zahlen Thüringens befasste. Warum verdammt sehen wir hier nur kaum einen Rückgang der Reproduktionszahl seit den Kontaktbeschränkungen?

Was noch nicht gestiegen ist, kann auch nicht fallen.

Nun ja: Thüringen bietet an Datenfülle nicht unbedingt das, was man sich im Sinne einer statistisch geeigneten Grundgesamtheit wünschen würde, um eine Reproduktionszahl schätzen zu können. Hier und da fallen mal einige Infektionsherde auf, die dann alsbald unter Kontrolle gebracht werden - nicht, dass ich mich darüber beschweren würde. So schwankt R seit einigen Wochen um einen Wert von 1 herum. Und die Schulschließungen haben wohl noch stattgefunden, bevor sich Corona überhaupt in Schulen oder Kitas anmelden konnte. Woher soll ein nennenswerter Rückgang von Zahlen also kommen, wenn diese noch gar nicht in Größenordnungen vorhanden waren - abgesehen von einzelnen Hotspots?

War es mit Ischgl nicht ähnlich?

"R" war noch gar nicht gestiegen Mitte März. Corona ist einfach nur angekommen - in Deutschland und in unserer Statistik. Zur echten exponentiellen Ausbreitung hatte es hier vor Ort bis dahin noch nicht wirklich viele Gelegenheiten.

Wenn ich also die "echte" (oder zumindest eine bessere) Reproduktionszahl vor den Kontaktbeschränkungen wissen wollen würde, müsste ich die aus Ischgl importierten Fälle irgendwie ausblenden - also den Teil, der quasi über Nacht da war und die Reprodutionstzahl Anfang März Größenordnungen weit über 2 hob.

Vergleichbar ist die Entwicklung von R in Thüringen übrigens dennoch mit den Werten im großen Bundestrend - nur um einige Tage versetzt. Auch das ist ein Indiz dafür, dass Covid 19 gar nicht so viel später ankam, als an den meisten anderen Orten, von dem Ausbruchsgeschehen um Heinsberg mal abgesehen.

Wer aus Ischgl kam, war sensibilisiert.

In meiner weiteren Betrachtung gehe ich nun davon aus, dass zumindest die Rückkehrer aus dem Skiurlaub, mehrheitlich sensibilisiert waren. Diejenigen mit bekannten Covid-19 Kontakten sollten weitestgehend in Quarantäne gewesen sein, viele offiziell und manche vielleicht auch heimlich für sich. Und sicher haben auch sonst die meisten Rückkehrer etwas Vorsicht walten lassen. Kurzum: Es kamen zwar zahlreiche infizierte Personen an, welche aber nur wenige weitere Personen ansteckten. Für diesen "Mikrokosmus" müsste man eigentlich unterstellen können, dass die rechnerische Reproduktionszahl im ersten Moment durch den reinen Import deutlich gestiegen und alsbald durch geübte Zurückhaltung wieder gefallen ist.

Doch einige unentdeckte Fälle bleiben und breiten sich dann doch weiter aus. Wäre dem so, könnte es gut sein, dass der oben beschriebene Rückgang durch geübte Zurückhaltung der Rückkehrer den darauf folgenden tatsächlichen Anstieg der Reproduktionszahl überlagert und sogar überkompensiert. Wo kein Anstieg sichtbar wird, kann auch kein Rückgang folgen.

Die Fälle aus Ischl blenden uns. Sie sind wie ein Blitzlicht, nach welchem wir für einige Momente nicht erkennen, was geschieht. Und erst langsam regeneriert sich der Blick.

Ich habe mir hierzu für Thüringen die Altersgruppen angesehen, denen man üblicherweise eine Après-Ski-Party in Ischgl andichten würde. In Verbindung mit den Hinweisen aus den nordischen Ländern für die ersten beiden Märzwochen konstruierte ich eine beispielhafte Korrekturgröße für die Fallzahlen in diesem Zeitraum: Reine Expertenschätzung!

Reproduktionszahl mit hypothetischer Ischgl-Korrektur.
Neuerkrankungen Thüringen mit korrigierten Zahlen Anfang März und daraus abgeleitete Reproduktionszahl.

Dabei war ich auch etwas großzügiger und habe im Sinne dieser Was-wäre-wenn-Analyse 40% der Fälle mit Erkrankungsbeginn bis 25. März korrigiert (Inkubationszeit zuvor ist zu bedenken).

Die Veranschaulichung zeigt, dass unter diesem Gesichtspunkt die wahre Reproduktion erst in der zweiten Märzhälfte ihre Fahrt aufnimmt und dann auch deutlich über 1 liegen würde. Das wäre in etwa der Zeitraum, in welchem auch Schulschließungen und Kontaktbeschränkungen bereits eingeleitet waren.

Mir geht es hier wohlgemerkt um eine Veranschaulichung möglicher Effekte, die durchaus überzeichnet sein können und dürfen.

Plötzlich wird auch in der Reproduktionszahl sichtbar, was nicht zu sehen war.

Es lässt sich also zumindest ein Szenario konstruieren, weshalb die eindämmenden Wirkungen aus Schulschließungen und vor allem Kontaktbeschränkungen doch vorhanden sind und in welchem diese größer ausfallen als wir es messen konnten. Wir sehen es nur nicht, wenn wenige Tage zuvor unzählige neue Fälle importiert wurden, welche die Bezugsgrößen aus den Tagen und Wochen zuvor deutlich anheben.

Das Szenario zeigt, dass es im Rahmen der Möglichkeiten liegt. Die eingeleiteten Maßnahmen hätten wiederum viel mehr bewirkt als wir messen können.

Vor allem mahnt uns dieses Szenario aber zur Vorsicht, wenn es jetzt um die Lockerung von Maßnahmen geht.

Ist "R = falsch"?

Nein. Aus meiner Sicht ist die Reproduktionszahl weiterhin eine sehr wertvolle Steuerungsgröße. Nur bei der Interpretation von Vergangenheitswerten, welche unter sehr spezifischen Rahmenbedingungen ermittelt wurden und deren Veränderung ist Vorsicht vor schnellen Rückschlüssen geboten.

Wir müssen erkennen, wo die eingesetzten Modelle und deren Prämissen ihre Grenzen haben und die Wirklichkeit eine andere ist als es unser Modell erfassen kann.

Die aufgeführten Szenarien zeigen zwei mögliche Irrtümer. Beide zusammengenommen würden bedeuten, dass die echte Reproduktionszahl zum Zeitpunkt der Kontaktbeschränkungen noch deutlich über 1 gelegen haben kann und sich demzufolge erst später im Zuge der Maßnahmen deutlicher gemindert haben würde. Wir wissen es nicht, aber es ist nicht nur möglich, sondern für meinen Geschmack sogar plausibel - plausibler als die Annahme, dass die Kontaktbeschränkungen so wenig gebracht haben sollen.

Wahrscheinlich haben sie sich mehr gelohnt. Doch genauso groß wie das, was wir nicht gesehen haben, könnte auch das Risiko sein, welches mit vorschnellen oder euphorischen Lockerungen einhergehen würde. Die Gefahr eines exponentiellen Wachstums neuer Infektionen könnte doch näher liegen als und zerbrechlicher sein als manch einer denkt.

Mut zum gesunden Menschenverstand.

Mir selbst zeigen diese Szenarien auf jeden Fall, dass es sich lohnt, diese Modelle um eine gute Portion gesunden Menschenverstand zu ergänzen. Das Urteil darüber, was nun die Wirklichkeit ist, wird dadurch nicht einfacher. Aber vielleicht wird es schlüssiger, wenn wir den Mut dazu haben, auch dem zu vertrauen, was wir nicht oder noch nicht messen können und dennoch erahnen.

____________

Hinweise zu Berechnungen: Die Berechnungslogik lehnt sich in vereinfachter Weise an die Systematik des RKI an. Im Beitrag geht es jedoch darum, veranschaulichend mögliche Effekte und deren Einfluss zu illustrieren. Ein akademischer Anspruch ist hiermit nicht verbunden.

Andreas Wenzel Verfasst von:

Entwickelt und prüft als Consultant seit mehr als 15 Jahren Risikoquantifizierungs- und -steuerungsmodelle im bankaufsichtlichen Kontext.


Coronavirus: Reproduktionszahlen Bundesländer

täglich um 10:00 Uhr aktualisiert mit PDF-Download - eigene Modellschätzungen