Switzerland

Wie und mit welchen Daten wir die weltweite Ausbreitung des Coronavirus zeigen

Warum die NZZ nicht ausschliesslich die Daten des Bundesamts für Gesundheit (BAG) nutzt, um die Ausbreitung des Coronavirus zu analysieren und zu zeigen. 

Barnaby Skinner

Noch nie wurde weltweit eine Pandemie in Echtzeit verfolgt. Stündlich, gar minütlich, erreichen uns neue Informationen und neue Zahlen. Den Überblick zu behalten, fällt selbst den besten Epidemiologen und auch den Behörden schwer, etwa dem Bundesamt für Gesundheit (BAG).

Zur Erarbeitung einer Schweizer Coronavirus-Datenbank ist das BAG auf die Meldungen aus den Kantonen angewiesen. Um etwa Doppelmeldungen zu vermeiden – zwei Kantone, die denselben Fall melden, etwa bei Wochenendaufenthaltern – prüft das Amt deshalb sorgfältig jeden einzelnen Coronafall. Zu wie vielen Doppelmeldungen es kommt, gibt das Amt nicht an. Doch der Prüfungsprozess führt selbstredend zu zeitlichen Verzögerungen. 

Die Zahlen des Bundes sind nicht falsch, nur veraltet

Bestätigte Meldungen der Kantone von Coronavirus-Fällen pro Tag im Vergleich zu denjenigen des Bundesamts für Gesundheit (BAG), 7.3. bis 26.3

05001000150020002500

Das ist allerdings nur ein Grund dafür, weshalb die Kantone dem Bund mit Informationen zu den Schweizer Fallzahlen einen Schritt voraus sind. Der zweite Grund betrifft die Publikationsform der Daten. Das BAG besteht seit dem Ausbruch der Krise darauf, die neusten Daten in hübsch formatierten PDFs zu verpacken. Erst kürzlich hat es damit begonnen, die Rohdaten in Excel-Dateien zu veröffentlichen. Das bedeutet: Um mit den Daten arbeiten können, müssen Forscher und Journalisten sie jeweils mühsam von Hand abtippen und in die eigenen Tabellenkalkulationsprogramme übertragen. Mit Excel-Dateien geht dies nun einfacher. Doch eine vollautomatisierte Auswertung ist noch immer nicht möglich, da sich die Datenstruktur jederzeit ändern kann.

Auf Kantonsebene hat sich in der Coronakrise eine gänzlich andere Praxis etabliert. Das Statistische Amt des Kantons Zürich hat in den letzten Wochen Schritt für Schritt auf der Entwickler-Plattform Github eine öffentlich zugängliche, stündlich aktualisierte Datenbank gebaut. Die Daten werden teils händisch, teils mithilfe von Software-Skripten aktualisiert, die regelmässig kantonale Websites nach neuen Daten durchsuchen. Wenn etwa der Kanton Appenzell-Ausserrhoden neue Fallzahlen oder die Anzahl verstorbene Personen auf seiner Website veröffentlicht, dann ist diese Information kurze Zeit später in der zentralen Datenbank verfügbar. 

Die Zürcher Software-Skripte sind nicht nur schnell. Sie legen die Daten auch in einem universell verständlichen Format ab. In der Fachsprache heisst das: die Daten sind maschinenlesbar. Das ermöglicht es Forschern und auch Redaktionen wie der NZZ, auf Knopfdruck Grafiken und Analysen mit den neusten Angaben zu ergänzen und von Experten interpretieren zu lassen.

Das Statistische Amt des Kantons Zürich sorgt auf der Entwicklerplattform Github dafür, dass die Daten der Coronavirusfälle aus den Kantonen möglichst aktuell und maschinenlesbar sind.

Das Statistische Amt des Kantons Zürich sorgt auf der Entwicklerplattform Github dafür, dass die Daten der Coronavirusfälle aus den Kantonen möglichst aktuell und maschinenlesbar sind.

Sceenshot Github

Das BAG ist nicht die einzige nationale Gesundheitsbehörde, die die Öffentlichkeit in der Coronakrise weniger gut mit Daten versorgt als Dritte. In Deutschland hinkt etwa das Roland-Koch-Institut den Entwicklungen in den Bundesländern immer einen Schritt hinterher. Und in den USA hat die «New York Times» selber damit angefangen, die Daten auf Bezirksebene zusammenzutragen und mit der Öffentlichkeit zu teilen, weil dies der nationalen Behörde nicht gelingt.

Auf globaler Ebene sind Forscher der Johns-Hopkins-Universität in Baltimore bereits seit Ausbruch der Pandemie damit beschäftigt, jeden Tag offizielle und inoffizielle Daten zusammen, darunter Daten der Weltgesundheitsorganisation (WHO), des amerikanischen Center for Disease Control, des europäischen Centre for Disease Prevention and Control und der chinesischen National Health Commission. Um neue Fälle zu identifizieren, überwachen die Forscher zudem Twitter-Feeds und Online-Nachrichtendienste. Bevor sie die Daten manuell aktualisieren, bestätigen sie die Fallzahlen mit Hilfe regionaler und lokaler Gesundheitsbehörden, der Weltgesundheitsorganisation (WHO) sowie der Gesundheitsbehörden auf Stadt- und Staatsebene.

Und wie das Statistische Amt des Kantons Zürich publiziert die Johns-Hopkins-Universität die Daten maschinenlesbar auf der Entwickler-Plattform Github. Das erlaubt es Redaktionen wie der NZZ, für die Leserschaft beinahe in Echtzeit aufzuarbeiten, wie es um die globale Verbreitung des Coronavirus steht; etwa für die verdichtete Darstellung zuverlässiger Informationen in folgender Form.

Auch die Daten der Johns-Hopkins-Universität (JHU) sind nicht vollständig. Tatsächlich sind weltweit bereits wesentlich mehr Leute mit dem Coronavirus infiziert, als in der Datenbank erfasst sind, da viele Infizierte gar nie auf das Virus getestet werden.

Wie die Daten zu interpretieren sind, wo Lücken sind, das weist die JHU aus. Genauso sorgfältig sind überall auch die Datenquellen angeben. Und vor allem ist die Datenbank so gestaltet, dass sie präzise mit Computer-Code angesteuert werden kann, damit bei der Weiterverarbeitung der Daten möglichst wenig Fehler passieren und Ergebnisse stets nachvollziehbar gemacht werden können.

Mitarbeit: Alexandra Kohler, Nikolai Thelitz, Roman Karavia, Jonas Oesch

Football news:

Es besteht eine Reale Chance, dass 50 bis 60 Vereine in Konkurs gehen. Der Besitzer von Huddersfield über die Auswirkungen der Pandemie
Valverde über das Spiel gegen Manchester City: wir Wollen so spielen, dass wir weiterkommen. Real ist bereit, alles dafür zu tun
Die große Auswahl von Roma: Cafu öffnet sich im Strafraum und wartet auf den Pass, aber stattdessen erzielen Totti und Batistuta Meisterwerke
Zabitzer hatte sich im April an einem Coronavirus erkrankt
In den 90er Jahren spielte der russische Klub in der finnischen Meisterschaft: die Spieler trugen Zigaretten, der Präsident ging auf das Feld. Es endete mit einem Ausfall
Flick über Holand: Er macht seine erste Saison, so früh ist er mit Lewandowski zu vergleichen
Felix hat sich im Training ein Bänderriss im Knie zugezogen. Es ist seine 3.Verletzung pro Saison bei Atlético