Ende der Durststrecke? Die (un-)vollständigen Daten Berliner Trinkbrunnen

IMG_0773 Berliner Wasserbetriebe. Hochgeladen am 18. Mai 2018. Aufgenommen am 27. September 2014. Bestimmte Rechte vorbehalten.

Der Sommer in Berlin macht gerade eine Pause, aber der Klimawandel schreitet dennoch rasant voran. In diesem Jahr wurden wieder neue Hitzerekorde bei den Luft- und Meerestemperaturen erreicht; der Juli 2023 gilt als heißester Monat seit Beginn der Wetteraufzeichnungen. Was bedeuten diese Rekorde für die Zukunft, für deutsche Städte wie Berlin? Diese steigenden Temperaturen wirken sich auch auf das tägliche Leben aus, und es müssen Maßnahmen getroffen werden, um die Auswirkungen der Hitze zumindest zu mindern.

In den Großstädten, die sich im Sommer schnell erhitzen, können einfache Maßnahmen wie regelmäßiges Trinken erheblich zum Hitzeschutz beitragen. Was zunächst nach der Verantwortung jedes Einzelnen klingt, ist aber ebenso eine Frage der städtischen Infrastruktur: Kostenlose Trinkangebote im Stadtraum sorgen dafür, sich unterwegs problemlos mit genug Wasser versorgen zu können.

Vor ein paar Wochen, an einem dieser besonders heißen Tage, habe ich beschlossen, mir die Datenlage zu den Standorten der Berliner Trinkbrunnen einmal genauer anzusehen. Nach dem ersten Googeln landet man zuverlässig auf der Seite der Berliner Wasserbetriebe. Auf der Seite Öffentliche Trinkbrunnen findet man tatsächlich schnell eine ansprechende und übersichtliche Karte aller Standorte.

Kurz zum Hintergrund: Berlin hat bereits 2016 damit begonnen, 32 öffentliche Trinkbrunnen zu installieren, aus denen stetig frisches Trinkwasser sprudelt. Mittlerweile ist diese Zahl im Jahr 2023 auf ganze 222 Trinkbrunnen gestiegen und könnte in Zukunft noch weiter wachsen.

Was mich auf der Seite allerdings erstaunte, war, dass kein Download der Trinkbrunnen-Standorte angeboten wird. Auch eine Suche über das Portal Offene Daten Berlin führt ins Leere. Das ist schade, denn der Datensatz scheint einerseits leicht zugänglich und andererseits attraktiv genug, ihn öffentlich zugänglich zu machen. Beispielsweise finden die Standorte in der Erfrischungskarte des Berliner CityLAB durchaus Verwendung.

Wenn die Stadt schon keinen Zugang zu den Daten bietet, bleibt wie so oft nur der alternative Zugriff auf die Daten über OpenStreetMap. Nach einem oberflächlichen Abgleich stellte ich fest, wie die OSM-Daten im Vergleich mit denen der Wasserbetriebe einige Lücken aufweisen. Wenn die Standorte von der Stadt schon nicht als Offene Daten zur Verfügung gestellt werden, könnte man sie zumindest nutzen, um Leerstellen in den Daten von OpenStreetMap zu identifizieren.

Mithilfe der Programmiersprache Python habe ich ein Script geschrieben, das zunächst beide Datensätze gemeinsam auf einer Karte darstellt. Was nun folgt, ist eine sogenannte Pufferanalyse, ein Standard beim Arbeiten mit Geodaten. Um jeden Trinkwasserbrunnen in den Daten der Wasserbetriebe wird automatisiert ein Radius von fünfzig Metern gezogen. Als nächstes betrachtet das Skript, ob einer der auf OpenStreetMap verzeichneten Brunnen in dem Radius liegt. Ist das der Fall, wird der städtische Brunnen auf einer Karte grün markiert. Das bedeutet mit einiger Wahrscheinlichkeit, dass der Brunnen auch auf OpenStreetMap korrekt eingetragen ist. Findet sich kein OSM-Trinkbrunnen im Umkreis eines Wasserbetriebe-Brunnens, wird dieser als rot und damit fehlend markiert.

Karte Trinkwasserbrunnen

Mit dem genauen Abgleich konnte ich meine anfängliche Beobachtung untermauern: Obwohl viele Freiwillige täglich in ihrer Freizeit an der Aktualität der OpenStreetMap Plattform arbeiten und Neuerungen oft schnell einpflegen, kann es schwierig sein, den Vollständigkeitsgrad derer zu erreichen, die die Infrastruktur selbst bereitstellen und dadurch hoffentlich präzise dokumentieren (auch für diese Regel soll es Ausnahmen geben).

Trinkwasserbrunnen Screenshot der Karte für den Abgleich zwischen den eingetragenen Brunnen der Wasserbetriebe und OpenStreetmap

Und wie geht es weiter? Gegen ein automatisiertes Einpflegen der Daten in den OpenStreetMap-Datensatz sprechen gute Gründe. Besonders die unklare rechtliche Situation: Wenn der Datensatz der Berliner Stadtwerke nicht offen zur Weiterverwendung gekennzeichnet ist, können die Daten nicht ohne rechtliche Bedenken zur Vervollständigung der OSM-Daten genutzt werden. Hier liegt der Ball bei den Berliner Wasserbetrieben, auch abseits der Nützlichkeit der Daten für OpenStreetMap, eine Möglichkeit zu finden, diesen praktischen Datensatz unter einer offenen Lizenz anzubieten.

Tim Fangmeyer
Tim Fangmeyer
Aspiring data engineer and part-time wordsmith