In den letzten Jahren begegnet man immer wieder Pressemitteilungen zu „Datenraeumen“. Egal ob „urbaner Datenraum“ oder „Datenraum Mobilitaet“, aus irgendwelchen Gruenden will man nun nicht mehr nur Daten haben, sondern in der schoenen Tradition der Komposita muss man jetzt irgendwas dranhaengen, und jetzt ist es eben ein „Raum“.
Ich habe lange nicht verstanden, was es damit auf sich haben soll, und witzigerweise enden auch Nachfragen, was denn der Unterschied eines Datenraums zu einer Datenbereitstellung ist, oder was einen urbanen Datenraum so urban macht, oft in Handwaving. Urbane Datenraeume sind offenbar deswegen urban, weil sie mit urbanen Datenplattformen passieren. Klar.
Erst die Vorstellung der „Datenraum Mobilitaet“ im Open Transport Meetup im Mai 2021 liess einige Lichter bei mir aufgehen. Und gleichzeitig ergaben auch einige andere Projekte, naja, nicht wirklich einen Sinn, aber ihre Intention wurde mir etwas klarer. Und oh boy, laesst sich die oeffentliche Hand da gerade wieder spektakulaer ueber den Tisch ziehen.
Aus sehr sehr weiter Entfernung klingt die Mischung aus Datenraum und zugehoerigen Datenplattformen gar nicht so ganz verkehrt: Irgendwie (vielleicht magisch) sollen Datenpunkte aus verschiedensten Quellen mittels eines Enterprise Service Bus eingesammelt und vereinheitlicht bereitgestellt werden. Und zweitens soll dieser Datenraum am Ende dann alles koennen: Dort sollen nicht nur Daten der oeffentlichen Hand landen, sondern auch von Unternehmen, von BuergerInnen, alles ist an einem Ort, Rehkitze springen hocherfreut durch die bluehenden Landschaften usw usf.
Bei genauerem Hinsehen stellen sich dann aber einige Fragen:
- Warum sollte ich als Privatperson oder Unternehmen die von mir erhobenen Datenpunkte auf dieser urbanen Datenplattform veroeffentlichen? Oeffentlich betriebene Internetdienste haben nicht den allerbesten Track Record dafuer, dass sie dauerhaft verfuegbar sind, dass URIs stabil bleiben, dass es keine ueberraschenden Datenreichtuemer gibt, dass Patches schnell eingespielt werden, etc pp.
- Wie soll denn eine Plattform alles koennen? Also gleichermassen einigermassen statische (versionierte) Datensaetze, aber gleichzeitig auch Zeitreihen z.B. von Sensornetzwerken?
- Wenn es am Ende (eigentlich logisch und notwendigerweise) sowieso mehrere verschiedene Plattformen fuer verschiedene Zwecke sind: Warum dann nicht gleich in Richtung Semantik und 5-Sterne-Open-Data arbeiten?
- Und wenn man in Richtung 5-Sterne arbeitet – ist dann ein verteiltes und verlinktes System nicht eh viel gescheiter, und es ginge einzig darum, passende Infrastruktur als Commodity einkaufen zu koennen (wovon auch die oeffentliche Hand profitieren wuerde)?
Das sind zumindest die Fragen, die ich mir parallel bei den Vorstellungen diverser Datenraeume und beim Betrachten von vermeintlich alles koennen sollenden Datenportalen gestellt hatte. Bis es eben bei der Vorstellung des Datenraums Mobilitaet klick machte: Das alles ergibt genau dann einen Sinn, wenn man von einer Annahme ausgeht, die ich gar nie in Betracht gezogen hatte, weil sie so grotesk und hanebuechen ist: Naemlich, dass man irgendwie Eigentum an Daten haben und sichern kann. Im Zweifelsfall per Digitalem Rechtemanagement.
Vielleicht ist daher die Anlehnung an den (physischen) Datenraum auf neutralem Boden im Rahmen eines Konzernverkaufs oder einer Uebernahme abgeleitet: Die oeffentliche Hand soll ein System bereitstellen, in das sie selbst und privatwirtschaftliche Unternehmen Datensaetze einstellen koennen, und dann sollen die Beteiligten auf irgendeine Weise entscheiden koennen, wer Zugriff auf die geteilten Datensaetze bekommt und zu welchem Zweck sie genutzt werden koennen.
Das Framing findet beispielsweise im Rahmen magischer Begriffe wie der „Digitalen Souveraenitaet“ statt: Man moechte die Kontrolle behalten, auch nachdem man etwas veroeffentlicht hat, und diese Kontrolle verleiht einem irgendwie Souveraenitaet. Dass das de facto eben nur mit digitalen Rechteverwaltungsverfahren geht, faellt stillschweigend unter den Tisch. Das ganze Verfahren ist also nicht nur komplett orthogonal zur Weiterentwicklung in Richtung 5-Sterne-Open-Data und den dafuer notwendigen (und nach dem Datenraum-Projekt immer noch nicht hergestellten) Voraussetzungen, sondern es ignoriert auch die komplette DRM-Debatte der 2000er-Jahre. (Es sei ja eh ODRL und kein DRM und das mache es alles besser, naja)
Gleichzeitig werden wieder die Memes der „grossen auslaendischen Konzerne“ ausgepackt, gegen die es sich zu schuetzen gelte. Warum das Problem vor allem in der Herkunft der Konzerne liegen soll und man gleichzeitig gerne Smart-City-Millionen mit inlaendischen Konzernen verbrennt, bleibt unklar.
Viel schlimmer finde ich aber, dass dieses Framing sich offenbar – ebenfalls in kompletter Verkennung der Diskussionen der letzten 15 Jahre – auch allgemein in Debatten ueber Open Data einschleicht. In der oben eingebetteten Rede von Jonas Hoffmann (SPD) zum von der FDP eingebrachten Open-Data-Gesetzesentwurf in Baden-Wuerttemberg (PDF, 17/513) geht es nicht nur auf einmal auch um personenbezogene Daten und Datenschutz, sondern ab 03:20 soll gar „sichergestellt werden“, dass „Open Data nicht nur auslaendischen Konzernen hilft“. Open Data wird rein als Arbeitsplatzmaschine gesehen – und auf einmal sollen ueber rechtliche und technische Konstrukte die gewerbliche Nutzung von Daten eingeschraenkt bzw Geld daraus beschafft werden.
Das ist nicht nur deswegen bemerkenswert, weil der FDP-Entwurf in Abs. 3 des zu schaffenden § 3a ganz ausdruecklich diejenigen Informationen ausnimmt, zu denen ein Zugang erst nach einem Drittbeteiligungsverfahren moeglich waere oder deren Veroeffentlichung Urheberrechte Dritter entgegenstehen. Rein auf Faktendatenebene bleibt dann sowieso nur noch das Datenbankherstellerrecht als Rechtsgrundlage fuer eine Einschraenkung der Nachnutzung – wir hatten das hier bereits. Der Entwurf haette vor allem dafuer gesorgt, dass all die Informationen, die per Landesinformationsfreiheitsgesetz ohnehin auf Anfrage zu veroeffentlichen waeren, nun eben von Anfang an veroeffentlicht werden sollen. Man koennte die Umsetzung des Entwurfs theoretisch Crowdsourcen. Naja.
Zum Anderen aber sind Daten, die nicht fuer jedwede Zwecke frei nutzbar sind, schlicht kein Open Data. Das kann man dann Hoffmann-Daten nennen oder sonst etwas, aber Open Data ist das nicht. Und ich finde es etwas erschreckend, dass wir darueber im Jahr 2022 immer noch diskutieren muessen. (Erneut der Verweis auf den Dateneigentum-Artikel samt zugehoeriger Links)
Die einzigen Profiteure solcher Konstrukte sind a) grosse aus… moment… inlaendische Konzerne, die ums Verrecken Datenhandel mit Faktendaten betreiben wollen, und b) die beteiligten Unternehmen und Berater, die im Rahmen grosser Foerderprojekte an den dafuer noetigen DRM-Verfahren und -Plattformen herumdoktorn. Bezahlt wird das indes aus oeffentlichen Foerdermitteln – und leider lassen sich oeffentliche Stellen dafuer einspannen, diese Projekte voranzutreiben. Waehrend sich die technischen Schulden an anderer Stelle weiter ansammeln, und nichts passiert, um Open Data vernuenftig und automatisiert bereitstellen zu koennen.
Ich kann nur dazu aufrufen, als aufgeklaerte Zivilgesellschaft solche Projekte enorm kritisch zu hinterfragen. Es ist nichts weiter als die kuenstliche Privatisierung von Commons – und das traegt nicht etwa dazu bei, die Marktmacht boeser grosser Konzerne zu mindern, sondern verursacht Kollateralschaeden, die Groessenordnungen ueber dem erwarteten Nutzen liegen.
PS: Es geht auch positiv. Das Badische Landesmuseum hat angekuendigt, die Daten zu 10.000 Objekten aus seiner Sammlung im Sommer unter CC-0 gemeinfreiaehnlich zu veroeffentlichen – 3D-Scans, Audiodateien, PDFs, Bilder, Videos. Die Beteiligten schrieben auf Linkedin sueffisant, dass das 2022 doch Standard sei. Baem.