Zum Umgang mit der unklaren Datenlage beim Coronavirus
Der große Augenmerk, der in vielen Medien auf die Zahl der offiziell Infizierten gerichtete wird, ist problematisch. Genauso wie darauf beruhende Berechnung von Verdoppelungszeiträumen und Vergleiche der Zahlen verschiedenen Länder miteinander. Warum?
In einem Interview mit der Schwäbischen Zeitung (5.4.2020) fasst Klaus Meier, Professor für Journalistik an der Katholischen Universität Eichstätt, die Problematik gut zusammen:
„Ich würde gerne etwas aufgreifen, was einerseits toll gemacht, aber andererseits hochproblematisch ist: Das sind Formate, die Zahlen zur Pandemie aufbereiten — interaktive Grafiken, die super gemacht sind und die viele Nutzer auch stark interessieren. Aber das führt dazu, dass man diese Zahlen wie Tabellenstände im Sport miteinander vergleicht: Sind wir jetzt schon wie Italien oder Spanien? Wie schneiden die USA ab? Wie stehen die Bundesländer und Landkreise in Deutschland da? Wer überholt wen? Die Zahlen werden für bare Münze in Echtzeit genommen. Aber auch wenn die Zahlen sauber recherchiert sind, können sie gar nicht das leisten, was man von ihnen erwartet: nämlich ein getreues Abbild der Wirklichkeit zu sein. … Man sollte immer wieder darauf hinweisen, welchen Hintergrund und welche Schwächen diese Zahlen haben. Journalisten sollten diese Zahlenfixiertheit hinterfragen und die Gültigkeit der Zahlen relativieren. Und Mediennutzer sollten sich nicht nur über Zahlen oder Tabellen informieren, sondern lieber zweimal am Tag längere Texte lesen, die diese Zahlen einordnen.“
Gernd Antes, Professor an der Medizinischen Universität Freiburg gilt als “Statistikexperte” und sagte im Interview mit dem Spiegel (31.03.2020):
Die Corona-Fälle, von denen wir jeden Tag im Fernsehen und Radio hören, beschreiben, wer positiv auf das neue Virus getestet wurde. Wie viele Menschen sich tatsächlich infizieren, wissen wir dagegen nicht. Die Schätzungen variieren extrem. Je nach Experten ist davon die Rede, dass sich fünf- bis zehnmal mehr Menschen infizieren als nachgewiesen werden. Manche Schätzungen liegen beim Zwanzigfachen oder sind noch höher. So eine Streuung ist ein sicheres Zeichen, dass niemand auch nur ungefähr weiß, wo die Wahrheit liegt. In der Folge können wir nur sehr grob abschätzen, wann und in welchem Umfang die Krankenhäuser mit schwer Erkrankten rechnen müssen.
Auf den Nachdenkseiten meinte der Statistiker Gerd Bosbach (03.04.2020) im Interview:
Ich bin nach wie vor überrascht, woher die politischen Entscheider die Sicherheit für die Richtigkeit ihres Vorgehens hernehmen, ohne die Zahl der Infizierten in der Bevölkerung zu kennen. Was sie kennen und worauf sie offenbar ihre Maßnahmen und das Festhalten an denselben stützen, ist die Zahl der positiv auf das Corona-Virus Getesteten. Das aber ist eine Größe, die extrem von der Anzahl der durchgeführten Tests abhängt … Die Zahl der positiv Getesteten umfasst eine kleine, nicht repräsentativ ausgewählte Gruppe. Es sind dies Menschen, die starke Krankheitssymptome aufweisen, wegen Vorerkrankungen oder ihres hohen Alters ein erhöhtes Risiko tragen, Kontaktpersonen im Umfeld von Infizierten sowie Personen, die nah am Patienten dran sind, wie Ärzte und Pflegepersonal. Um es salopp zu sagen: Wenn sie in dieser Gruppe morgen doppelt so viele Menschen testen wie heute, werden sie morgen wahrscheinlich auch fast doppelt so viele Infizierte finden wie heute. Daraus lässt sich aber weder ermessen, wie sehr das Virus in der Gesamtbevölkerung bereits verbreitet ist, noch in welchem Tempo es sich verbreitet.“
Jens Schröder, Datenschubser bei Meedia, hat sich am 02.04.2020 vorgenommen, regelmässig die Belegung der Intensivbetten zu untersuchen. Weil:
“Mein Problem an dieser Berichterstattung: Die Zahlen der Infizierten sind solang irreführend, solang die Dunkelziffer der Infizierten, die nicht getestet wurden, unbekannt ist … Deutlich relevanter sind die Zahlen der Patienten, die ins Krankenhaus müssen und vor allem derjenigen, die auf Intensivstationen behandelt werden müssen. Denn hier gibt es keine Dunkelziffer. Wenn jemand so krank ist, dass er auf eine Intensivstation muss, dann wird er auch dort landen. Zumindest so lang, wie die Stationen nicht überlastet sind. Die Dunkelziffer von schwer Erkrankten wird also klein oder sehr klein sein.
Auch Nate Silver von FiveThirtyEight warnt in einem längerem Beitrag (05.04.2020) über die reine Fixierung auf die erkannten Fallzahlen. Er dekliniert vier Szenarien durch, wie Coronavisustests ablaufen könnten und welche Auswirkungen das auf die entsprechenden Zahlen haben könnte.
But if you’re not accounting for testing patterns, it can throw your conclusions entirely out of whack. You don’t just run the risk of being a little bit wrong: Your analysis could be off by an order of magnitude. Or even worse, you might be led in the opposite direction of what is actually happening
Leider gibt es zu den Tests in Deutschland bislang nur wöchentlich Zahlen in den Situationsberichten des Robert Koch Instituts (RKI): mittwochs. Hier ist auffällig, dass bislang die Positivtestrate stieg. Dennochl lässt sich — ohne zu wissen, nach welchen Kriterien oder Systematik es zu einem Test gekommen ist — aus diesen Zahlen nicht viel herauslesen. Einzig wird klar: Die täglich berichtete Fallzahl von Corona-Infizierten ist einzig Ausdruck von der Anzahl der durchgeführten Tests — und sonst nichts.
Wie die Zahlen zustandekommen, hat das Institut in einem “Epidemiologisches Bulletin” (pdf) am 02.04.2020 erläutert. Dort wird auch auf die Testkapazitäten eingegangen. Diese scheint um einiges höher zu liegen als die tatsächlich durchgeführten Tests. Hier wäre interessant zu erfahren, ob ein logistisches Nadelöhr der Grund dafür ist und wo das liegt. Auch wäre spannend zu wissen, wie die Testkapazitäten regional verteilt sind und wie die regionale Auslastung aussieht.
Klar ist: Erst, wenn weitflächig und wiederholt repräsentative Tests wie sie jetzt in München durchgeführt werden sollen, geschehen, können demnächst validere Aussagen über den Stand der Pandemie herzulande getroffen werden.
In einer Tabelle habe ich begonnen die Daten, die meines Wissens nach rund um den Coronavirus vorliegen — oder nicht–, zu sammeln. Die Grafik eingangs versucht, eine Systematik davon zu zeigen.