Die broeselnden Fundamente maschinellen Lernens

Was in Firmenankuendigungen und sonstigen Buzz-Berichten „Kuenstliche Intelligenz“ genannt wird, ist in der Praxis meist Machine Learning – angewandte Statistik auf Basis von Trainingsdaten, mit der man den Rechner quasi „anlernt“, passend zu kategorisieren. Der alte Witz geht etwa so: Wenn es in Python geschrieben ist, ist es maschinelles Lernen. Wenn es in Powerpoint ist, ist es kuenstliche Intelligenz.

Machine Learning hat fuer sich schon einige relativ offensichtlichen Schwaechen. Biases in Trainingsdaten schlagen sich quasi automatisch auf das Verhalten des zu trainierenden Modells nieder. Wenn beispielsweise in Strafverfahren marginalisierte Bevoelkerungsgruppen fuer dieselben Vergehen haertere Strafen von Gerichten erfahren als Weisse, wird auch eine „unbefangene“ „KI“ diesen Bias weitertragen.

Cory Doctorow geht aber noch weiter: Machine Learning’s Crumbling Foundations heisst sein Artikel, und er beleuchtet sehr kritisch, wie die Trainingsdaten ueberhaupt erfasst werden, wer sie aufbereitet, und an welchen Stellen ueberhaupt ausreichend Domaenenwissen vorhanden ist, um ansatzweise sinnvolle Erkenntnisse aus ML-Prozessen gewinnen zu koennen. Lesenswert. (via @johl)

×

Ich musste auch deswegen bei der Lektuere ein wenig schmunzeln, weil KI einer von mehreren Dauerbrennern in Diskussionen mit EntscheidungstraegerInnen oder IT-Unternehmern war/ist. Das Muster ist dabei immer dasselbe: Das Thema ist mehr Projektionsflaeche mit total von der Realitaet entkoppelten Vorstellungen. Versuche, mit Realitaetschecks zu kontern und den notwendigen (und als gegeben angenommenen) Unterbau zu problematisieren, schlagen fehl. Zwei, drei Jahre spaeter kommen dann kritische Artikel auch in einer breiteren Oeffentlichkeit an und es kommt dann ein „ja hm da habt ihr wohl recht gehabt“. Derweil kommt dann die naechste Sau um die Ecke, egal ob bei Blockchain oder totgeglaubten Social-Bot-Debatten.

„Wie apt-get fuer Daten“, knapp 12 Jahre spaeter

Ich bin gerade noch einmal ueber den Vortrag „CKAN: apt-get for the Debian of Data“ vom 26C3 im Dezember 2009 gestolpert. Rufus Pollock (Gründer von Open Knowledge International) und Daniel Dietrich (Mitgruender des deutschen Ablegers, der OKFde) erklaerten damals ihre Vision eines Netzwerks von Datenquellen.

Das heute, knapp 12 Jahre spaeter noch einmal anzusehen, war… spannend. Ich zucke heute ueber das “this is when nerds run things” am Anfang peinlich beruehrt zusammen, aber es lohnt sich total, noch einmal aufzurollen, was in der Zwischenzeit alles (nicht) passiert ist:

  • Der gesamte Vortrag denkt in (vermeintlich) notwendigen Lizenzen fuer Daten – “Free Data“ von Denny Vrandečić wird erst drei Jahre spaeter veroeffentlicht werden. An ganz vielen Stellen betont Pollock, dass es total wichtig sei, irgendeine Lizenz anzugeben – das haelt sich leider an vielen Stellen bis heute und klebt uns als Bewegung am Bein.
  • Bei etwa 16:00 fragt Pollock nach Postleitzahlendaten: Gibt es die? Sind sie frei verwendbar? Jemand aus dem Publikum behauptet, dass dem so sei – tatsaechlich bekam Markus Drenger dieses Jahr Anwaltspost, weil er von staatlicher Stelle (versehentlich) veroeffentlichte Geodaten verbreitet hatte, inklusive der „lizenzierten“ Postleitzahlen.
  • Ueberhaupt, die ganze Idee von CKAN: Versionierung, Packages etc., wo sind wir 12 Jahre spaeter? Man denke nur an die RKI-Daten waehrend der Covid-Pandemie. Oder auch die gesamte Idee mit Dependencies und weiteren herunterzuladenden Datenpaketen. Die schmeckt ein wenig wie Linked Open Data – und ich haette das sehr gerne in der Praxis. Habe ich aber noch nie gesehen. (Bei 53:20 ff. wird das am Beispiel der Postleitzahlen beschrieben)
  • „Schaut mal, die Briten nehmen schon CKAN um Open Data zu veroeffentlichen und wir hoffen, dass das die deutsche Politik ueberzeugt, ebenfalls Open Data herauszugeben“. Ohweh, das tut weh.
  • Generell, die ganze Begeisterung – Daten werden wichtiger als Code werden, mit Gibson-Zitaten, etc.pp. – das haengt sicher auch mit meiner romantischen Vergangenheitsverklaerung zusammen, aber da kommt schon ein wenig Nostalgie auf 😉
  • Ab 44:36 kommt eine hervorragende Frage: Jetzt taucht da ein Katalog mit Daten auf – ist das langfristig nicht sowas wie es Webkataloge vor Websuchmaschinen waren? Sollte das nicht alles von Maschinen erfassbar und bearbeitbar sein anstatt haendisch? Pollock erklaert ein bisschen herum, aber in dem Austausch ist IMO ein Kernproblem der ganzen Datenportale bis heute sehr klar vorhergesehen.
  • Vor allem auch: Wer vertritt all diese Visionen heute ueberhaupt noch, um eher industriegetriebenen Memes wie dem „Datenraum“ etwas entgegenzuhalten? Wo bleibt das Zukunftsversprechen von Linked Open Data, so dass ich morgens nur einen Update-Befehl ausfuehren muss, um das (versionierte, aktuelle) Paket z.B. fuer die Impfdaten des RKI zu bekommen?

Logomachie: Theologisch-korrekte Powerworte und neoliberale Digitalisierungstrategien

Wer schon eine Weile in der Digitalisierungswelt unterwegs ist, stolpert irgendwann ueber die wellenfoermige Mem-artigkeit von Begriffen, die neu im Diskurs verwendet werden und dann eine gewisse Beliebtheit erreichen, bevor sie – eventuell – im Gebrauch wieder abflachen. „Smart“ scheint beispielsweise kaum totzubekommen sein, ist aber lange nicht mehr so hochmodisch, wie es mal war. Aktuell begegne ich immer wieder Begriffen wie „Resilienz“ oder auch der „Digitalen Souveraenitaet“, und ich muss zugeben, dass es mir mittlerweile zunehmend Freude bereitet, zu fragen, wie der gerade gefallene Satz denn formuliert werden koennte, ohne diesen Begriff zu verwenden.

An ein paar Stellen hatte ich vorher bereits Auseinandersetzungen mit dem Mode- bzw. Mem-Aspekt dieses Hypecycle mitbekommen. Klumpp drueckt das einleitend in „Digitalisierte urbane Mobilitaet“ (2016) – genauso snarky wie in weiten Teile des kompletten Dokuments – aus:

Keine lang laufende Diskussion verträgt aber Konstanten bei den verwendeten Begriffen und Begrifflichkeiten, weshalb in einer Zeit der Beschleunigung eben neue Termini erforderlich sind.

Klumpp, Dieter. „DIVSI Studie-digitalisierte urbane Mobilität: datengelenkter Verkehr zwischen Erwartung und Realität.“

Ein fehlendes Puzzlestueck war fuer mich aber die weitgehende Sinn- oder zumindest Definitionsbefreitheit vieler der verwendeten Begriffe: Was heisst denn „Souveraenitaet“ ueberhaupt? Wer ist gegen was „resilient“? Obwohl die Begriffe sehr haeufig und sehr selbstsicher eingesetzt werden, bringen solche Rueckfragen – oder die oben erwaehnte Bitte, den Satz doch mal inhaltsgleich aber ohne dieses Wort zu verwenden – das Gegenueber sehr schnell ins Schwimmen.

Einen ersten Aufhaenger fuer die Einordnung solcher inhaltslosen Begriffe hatte ich vor einigen Monaten in einem Thread von Simon Wardley zum Begriff der „Digitalen Souveraenitaet“ gelesen, der daraus mittlerweile einen lesenswerten Blogpost gemacht hat. Anders als ich – und das ist ja eben typisch fuer diese Interpretationsoffenheit – definiert Wardley den Begriff in einer raeumlichen Abgrenzung des nationalen (oder EU-zentrischen) Protektionismus, die gerade beim weltweiten Internet einfach keinen Sinn ergibt. Im Thread lieferte er aber einen grossen Aha-Moment fuer mich, diese Projektionsflaechenbegriffe einzuordnen:

Ein spannendes Faedchen, an dem ich dann sehr lange weiter ziehen und Dinge aufzuppeln konnte, lieferte nun vergangene Woche ein Tweet von Basanta Thapa:

Ich habe daraufhin gleich mal das zitierte Paper gesucht und wo es zitiert wird, und bin dabei ueber „Talking about government: The role of magic concepts“ (DOI 10.1080/14719037.2010.532963, ich rate natuerlich dringend davon ab, das z.B. auf SciHub zu suchen) gestolpert. Und das ist einfach wunderbar, weil Pollitt und Hupe darin sehr sueffisant die Rolle und auch die Charakteristika solcher „magischer Worte“ erklaeren. Waehrend man fuer viele Standpunkte oder Thesen einen gegenteiligen Standpunkt formulieren kann, der erstens Sinn ergibt und auch zustimmungsfaehig ist, sind die „magischen Konzepte“ so breit und universell ausgelegt, dass ihre Negation praktisch keinen Sinn ergibt. Sie machen das an den drei Beispielen „Governance“, „Accountability“ und „Network“ fest, auf die das gut zutrifft: „Keine Governance“ mag niemand so recht haben und ist schlecht vorstellbar – aber bei genauerem Hindenken faellt auf, dass auch „Governance“ selbst gar nicht so gut vorstellbar ist, weil es irgendwie alles und nichts ist. Pollitt und Hupe schlagen folgende Charakteristiken fuer solche magischen Worte vor:

1 Broadness. They cover huge domains, have multiple, overlapping, sometimes conflicting definitions, and connect with many other concepts. They have large scope and high valency.

2 Normative attractiveness. They have an overwhelmingly positive connotation; it is hard to be ‘against’ them. Part of this is usually a sense of being ‘modern’ and ‘progressive’ – often replacing something which is now alleged to be out-of-date (e.g. networks replace bureaucracy and/or hierarchy).

3 Implication of consensus. They dilute, obscure or even deny the traditional social science concerns with conflicting interests and logics (such as democracy versus efficiency, or the profit motive versus the public interest).

4 Global marketability. They are known by and used by many practitioners and academics – that is, they are fashionable. They feature frequently in official policy documents, the titles of reform projects and new units in both governmental and university departments. The concepts provide themes for academic conferences, subjects for seminars and titles for journal articles

Pollitt, Christopher, and Peter Hupe. „Talking about government: The role of magic concepts.“ Public Management Review 13.5 (2011): 641-658.

Ich halte es fuer wichtig, diese Begriffe vor allem in der Digitalisierungsdebatte zu dekonstruieren, wo immer wir ihnen begegnen. Erstens – und offensichtlich – weil sie interpretationsoffene Projektionsflaechen sind. In einem Diskurs ueber politische Ziele hilft es ungemein, sich der Bedeutung der gemeinsamen Sprache einig zu sein und eben nicht Schlumpfwoerter wie „smart“ zu verwenden, die lediglich die orthodoxe Rechtglaeubigkeit der aussprechenden Person bekraeftigen sollen.

Wie soll beispielsweise ein Datenethikkonzept dazu fuehren, ethisch mit Daten umzugehen? Welche Definition unethischen Datenumgangs faellt einem ueberhaupt ein, und woraus leitet sich die Ethik denn nun her und in welcher Utopievorstellung von Gesellschaft ist sie begruendet und warum kommt irgendwer auf die Idee, dass es hier eine universelle Vorstellung davon geben koennte? Kann es „ethischen“ Umgang mit Daten durch lokale Definitionen ueberhaupt geben, solange es nebenan Polizeiaufgabengesetze gibt, die sich um diese Ethik wenig scheren, sondern (wie im Fall der Corona-Registrierungszettel) einen konkurrierenden, rechtlich verbrieften Zugriffsanspruch haben, egal wie man selber das dagegen gerne absichern wuerde, fuer eine „ethische“ und vertrauensvolle Handhabung z.B. pseudonymisierter Mobilitaetsdaten? Wenn schon Governance undefinierbar ist, was ist dann Datengovernance? Wer governt denn ueber was, und wo gibt es wieder konkurrierende Akteure (z.B. wieder die Polizei)? Und was bringt mir eine Reflexion ueber Ausschluesse und strukturelle Benachteiligungen, wenn andere da mit reinfunken, die notorisch unreflektiert mit diesen Machtverhaeltnissen umgehen (again)?

Zweitens aber taeuschen viele dieser magical words zwar Universalitaet und auch Neutralitaet vor (“One might say that magic concepts are typical of what social theorists term ‘late modernism’, in the sense that they are of high abstraction and wide generality, and are usually presented as neutral (Scott 1998).”, aus Pollitt&Hupe 2011). Gerade in der Digitalisierungsdebatte kommt jedoch eine Vielzahl der Begriffe aus dem kleinen Woerterbuch des Neoliberalismus (vgl. z.B. Eagleton-Pierce, Matthew. Neoliberalism: The key concepts. Routledge, 2016) und werden ganz nebenbei in Diskursbeitraege eingeflochten – weswegen sich staendige kritische Nachfragen umso mehr lohnen:

Warum sprechen Akteure beispielsweise von Challenges, die es zu loesen gilt? Was waere ein alternativer Begriff und was das Gegenteil? Wie grenzt sich eine Challenge von einer Analyse systemischer Maengel ab, und warum macht man stattdessen lieber die Challenge? Wer oder was ist die Community, wovon waere sie abzugrenzen, wer definiert die Grenzen, und warum ist sie eine eigene Gruppe unter den Stakeholdern? Stellt Partizipation wirklich bestehende Machtverhaeltnisse in Frage und ermaechtigt die Buergerschaft (wer auch immer das sein soll), oder wird der Prozess aus der Machtstruktur heraus gesteuert und legt selber fest, wer eine Stimme hat und wer nicht? Aehnlich auch bei Co-Creation, geht es um “fundamentally changing the relationships, positions and rules between the involved stakeholders” (Voorberg, Bekkers & Tummers, 2015), oder soll eine Checkliste in einem Foerderantrag abgehakt werden? Was heisst es, wenn Verstetigung beispielsweise von Community(sic, klar)-Projekten angestrebt werden soll? Was zum Teufel waere das Gegenteil? Und was genau wird denn verstetigt? Foerdermittel, auf dass die Community (natuerlich nachhaltig) das Projekt auf alle Zeit weiterfuehrt? Quasi die zeitlich unbegrenzte Verstetigung einer Arbeit, die man nie dauerhaft machen wollte, weil man dachte, dass die oeffentliche Hand selber aus dem Quark kommt, das kuenftig besser zu machen? Oder soll das Ziel sein, diese oeffentlichen Aufgaben (am besten noch der Daseinsvorsorge) mit Entrepreneurship in privater Hand durchzufuehren?

Und so weiter.

Vielleicht waere hier mal ein Woerterbuch gut. Oder eben doch ein illustriertes Bilderbuch mit schoenen Metaphern, die diese Begriffsunklarheiten anschaulich aufdroeseln (Danke Julia Barthel fuer die Idee). Und es braucht auch dringend gut verstaendliche Gegenerzaehlungen, die die komplexeren aber eben auch zielfuehrenderen nachhaltigen Ansaetze mindestens ebenso attraktiv machen wie die neoliberalen Gegenstuecke, die gerade durch windelweiche und schoene Worte so leicht verdaulich fuer Entscheidungstraeger:innen sind.

Bis dahin: Bitte kritisch weiterfragen!

//edit: verwirrenden Satz klargestellt, Paper verlinkt. Siehe ausserdem auch anderen Beitrag zu User Centered Design.

Menschen, die auf Rankings starren

Seit letztem Herbst schwanke ich zwischen „ich sollte unbedingt endlich mal was zum Bitkom-Smart-City-Index schreiben“ und „das ist doch eigentlich offensichtlich und macht gar keinen Spass“. Jetzt gab es aber ein Update des Rankings, das herumgereicht wird, und das nehme ich jetzt einfach mal zum Anlass, auszusprechen:

  1. Der Bitkom-Smart-City-Index ist methodisch schwach
  2. die Rangfolge der Staedte darin hat kaum Aussagekraft
  3. als Indikator taugt er eigentlich nur, um vor den Leuten zu warnen, die ihn fuer bare Muenze halten.

Im besten Fall kann man ihn verwenden, um (bei einem genuegend schlechten Abschneiden) mehr Umsetzung vor Ort zu fordern – im schlimmsten Fall lenkt er (wie so vieles in dem Bereich) von den eigentlichen Baustellen ab. Dazu leidet er unter dem (typischen) Dashboard-Problem, dass er dazu verleitet, rein auf die Indikatoren hin zu optimieren, damit das Ranking besser wird. Da Ranking und tatsaechliche Problemloesung aber wenig miteinander zu tun haben, ist das im besten Fall nur schaedlich.

Was ist das ueberhaupt

Der sogenannte „Index“ wird seit 2019 vom Branchenverband Bitkom herausgegeben und soll nach eigenen Angaben „alle deutschen Großstädte in Punkto Digitalisierung“ vermessen. Im Bericht von 2019 wird einleitend ein Kapitel „Methodik“ vorgestellt, das die Bewertungskriterien etwas genauer erklaert als der Bericht von 2020.
Auffallend ist dabei:

  1. wie oberflaechlich die gewaehlten Kriterien sind
  2. dass sich die Kriterien teilweise ueber die Erhebungsjahre hinweg aendern und nicht direkt nachvollziehbar ist, ob sich eine veraenderte Einstufung in einer Kategorie auf eine tatsaechliche Veraenderung vor Ort zurueckfuehren laesst oder die Kriterienaenderung selbst
  3. dass die Zusammenhaenge einer strategischen, strukturellen Integration von Digitalisierungsmassnahmen sich kaum im Index wiederfinden

So ist die Bezahlung per Karte oder e-Payment bei Behoerdengaengen eine eigene Kategorie, nicht aber die Integration in Online-Verfahren. Generell scheint das gesamte Thema OZG und vor allem die dafuer notwendige Tiefenintegration der erforderlichen Massnahmen keinerlei relevante Rolle zu spielen: Nicht nur die Bezahldienste stehen komplett losgeloest von moeglichen Onlinedienstleistungen da, auch die Online-Terminvergabe fuer notwendige Amtstermine luemmelt im Methodenkapitel unmotiviert zwischen den Stuehlen. Weniger als 10 der 575 OZG-Leistungen spielen eine Rolle fuer den Index. Es wird dabei nicht erklaert, warum es gerade diese sind. Theoretisch koennte eine Kommune hunderte OZG-Dienstleistungen im hoechsten Reifegrad anbieten und trotzdem schlecht abschneiden, wenn es eben nicht gerade die ausgewaehlten sind.

Gleichzeitig ist eine ganze Reihe der Indikatoren Hype-getrieben. Wer Chatbots zum gaehnen findet, nicht der Show wegen automatisierte Fahrzeuge im ÖV (de facto wohl eher auf abgesperrten Teststrecken) testet, oder den Nutzen eines „Smart City Dashboard“ in Frage stellt (was zur Hoelle auch immer das konkret sein soll), bekommt im Ranking weniger Punkte. Ob das ein Indiz fuer Nicht-Smart-heit ist, oder ob es einfach eine solide Einschaetzung ist, welche Sau man nicht durchs Dorf mitreiten will, kann man sich dabei selber ueberlegen. Nur wer auf der Sau sitzt, kann aber auf eine Spitzenposition hoffen – und die pauschale Zusammenfassung der Bereichspunktzahlen macht es fuer Dritte praktisch unmoeglich, nachzuvollziehen, welche fehlenden Punkte jetzt dem Verzicht auf den Hype geschuldet sind.

Wirklich seltsam wird es aber, wenn man sich die Bewertungen einzelner Staedte in den Kategorien genauer betrachtet, die man selber zu bewerten in der Lage ist. Im Bereich „City-App“ bekommt die Stadt Ulm beispielsweise 66,67 von 100 moeglichen Punkten, und ich habe keine Ahnung, warum – die App ist nun bald 10 Jahre alt, was man recht deutlich sieht. Viel spannender faende ich ja an der Stelle als Indikatoren fuer eine „smarte“ Stadt, wie viele der dort gesammelten Informationen auch als Open Data ueber standardisierte Schnittstellen verfuegbar sind, aber naja. Wie viel die 66,67% fuer die City-App jetzt fuer die Gesamtwertung des Bereichs Verwaltung ausmachen, konnte ich indes nicht nachvollziehen – die Gesamtwertung scheint noch irgendwie gewichtet zu sein und ist nicht der Durchschnitt der Einzelwerte. Auch die Gewichtung selbst und die Begruendung dafuer sind nicht transparent nachvollziehbar. Ich hatte mir beispielhaft die bewerteten Teile hoch gerankter Staedte angesehen um die Bewertung nachvollziehen zu koennen, und habe z.B. bei der Stadt Aachen eine, hm, witzige Website gefunden, die kein TLS macht und OSM-Kartentiles von Wikimedia einbindet. Welche Rolle das fuer das Abschneiden hat, ist nicht klar.

Ich haette im Bereich Verwaltung auch gerne im Detail gesehen, wie die Maengelmelder bewertet werden, und wie ueberhaupt dieser Bereich bewertet werden soll. Geht es um bruchfreie Prozesse bis zu den ausfuehrenden Stellen? Sollen moeglichst alle gemeldeten Maengel schnell auf gruen/erledigt geschaltet werden (selbst wenn die zugrunde liegenden gemeldeten Maengel gar nicht erledigt sind)? Allein an diesem Beispiel zeigt sich schnell, wie tief man eigentlich in die Thematik eintauchen muesste, um ueberhaupt ein halbwegs realitaetsnahes Bild des tatsaechlichen notwendigen strukturellen Unterbaus als auch nur annaehernden Indikator fuer „Smartness“ zeichnen zu koennen. Ich habe ernsthafte Zweifel, dass der hierfuer notwendige Aufwand in die Erstellung des Index fliesst. Vielfach scheint hier auf ein freiwilliges Selbst-Reporting der Staedte gesetzt worden zu sein, was eher ein Indiz fuer gute Oeffentlichkeitsarbeit waere.

Im Bereich „IT und Kommunikation“ kommen wir zu einem immer wiederkehrenden Thema der Erhebung: Arbitraere Bewertungsschwellen, und nichtssagende Faktoren. „Public WLAN“ wird in die drei Bereiche Abdeckung, Verfuegbarkeit (hier ist unklar, ob in Abgrenzung zur Abdeckung z.B. ein Servicelevel gemeint ist) und „Begrenzung“ eingeteilt, wobei bei letzterem nicht aus dem Bericht hervorgeht, was genau damit gemeint ist. Vermutlich scheint aber eine Datenraten- oder Zeitlimitierung gemeint zu sein, denn wenn man sich die erhobenen Staedte betrachtet, bekommen reihenweise Staedte Top-Scores, die auch 2020 immer noch ohne Not vorgeschaltete Captive Portals fuer ihr Public WLAN betreiben. Meines Erachtens ist ein CaPo (bzw. wann es endlich abgeschafft wurde) derweil ein hervorragender Negativindikator fuer Leistungs- und Modernisierungsfaehigkeit. Witziges Kriterium waere z.B. auch, in welcher Frist man wenn man wollte einen Dienst wie eduroam ausgerollt bekaeme. Oder wie gut die dahinterliegende Infrastruktur skaliert. Aber auch hierfuer ist die gewaehlte Erhebung viel zu oberflaechlich.

Bei IoT-Netzwerken sieht die Bewertung aehnlich ausgewuerfelt aus. Hier haben sich 2019 zu 2020 offenbar auch die Kriterien geaendert: 2019 waren es die Anzahl der LoRaWAN-Gateways pro km² und ob es eine offizielle TTN-Community gibt. 2020 stehen „LoRaWAN (Gateways, offizielle Community)“ und „Narrowband IoT“ als Kriterien in der Liste. Fuer 2019 habe ich nicht einmal eine detaillierte Auflistung der gewerteten Punkte gefunden, hier gibt es im offiziellen Bericht nur eine Sammel-Punktzahl pro Bereich. Allein die Existenz einer oertlichen TTN-Community heisst aber nicht, dass es vor Ort einen intensiven Austausch mit z.B. der Stadt oder der Wirtschaft gibt. Es soll oertliche TTN-Communities geben, die sich intensiv ueberregional vernetzen, und wo man dennoch die oertliche Wirtschaft regelmaessig zum Jagen tragen muss, wenn es um die praktische Umsetzung von IoT jenseits von Buzzwords geht. Und dafuer, ob es vor Ort NB-IoT gibt, kann eine Stadt herzlich wenig – und wieso sollte sie auch, wenn es ein gutes freies LoRaWAN vor Ort gibt, das allen Menschen zur Verfuegung steht?

Damit sind wir dann auch bei der Reihe weiterer Faktoren, fuer die eine Stadt wenig kann und die noch absurder wirken. So wird die reine Existenz privatwirtschaftlicher Bike- oder Scooter-Sharing-Dienste in der Stadt bepunktet. Viel viel spannender waere hier, ob und wie die Staedte hier die Integration der Dienste in intermodale Auskuenfte als Open Data sicherstellen (wird nicht bepunktet, es gibt nur den Abschnitt „intermodale App“, auch wenn das die 181. Closed-Source-Wollmilchsau-App ohne jegliche Interoperabilitaet sein soll) oder ob sie die Statistikdaten gemaess MDS bekommen und auswerten (nirgendwo als Kriterium zu finden). Das waeren wirkliche Indikatoren fuer die Apdation datengetriebener Methodik. Aber nein, es reicht offenbar, einen Smart-Parking-Dienst irgendwo zu kaufen, um „Smart“ zu sein.
Dieser Tenor setzt sich auch im Abschnitt „Gesellschaft“ fort. Allein die Existenz eines CCC-Erfa, Code-for-Germany-Labs oder einer GI-Ortsgruppe(?) werden bepunktet. Es ist dabei egal, ob und wie Stadt und diese Zivilorganisationen miteinander interagieren – wer einen Erfa hat, bekommt Punkte. Ich fuehle mich auch hin- und hergerissen, ob ich mich ueber das Indikator-Kriterium „Existenz eines CfG-Labs“ freuen soll. Einerseits ist es schoen, dass dieses Engagement hier als wichtig hervorgehoben werden soll. Andererseits gilt genauso der Punkt dass die Interaktion zwischen Verwaltung und CfG der ausschlaggebende Punkt ist; und zudem gibt es auch Organisationsformen ausserhalb von CfG, die aequivalent wirken koennen. Die wesentlichen Grundsteine im Austausch zwischen Stadt und unserer Open-Data-Truppe wurden zwischen 2010 und 2014 gelegt – also noch bevor es CfG gab. Aus genau dieser Zeit stammt denn auch noch das Open-Data-Portal der Stadt Ulm, auf dem auch seit Jahren kaum viel mehr an Daten gelandet ist, und das muehsam haendisch gefuettert wird, anstatt automatisch – dem Bitkom reicht das fuer 90 von 100 Punkten, und wer mir erklaeren kann, warum, bekommt ein Eis von mir.

Es ist eigentlich muessig, weiter ueber dieses „Ranking“ zu schreiben, und es macht mir auch maessig Spass, weil die komplette Methodik intransparent und praktisch ueberhaupt nicht nachvollziehbar ist.

Die wirkliche Aussagekraft des Rankings erschliesst sich mir ueberhaupt nicht. Es handelt sich praktisch durchgehend allenfalls um Indizien, die Grundlage einer genaueren Beschaeftigung der tatsaechlichen Umsetzung in den jeweiligen Staedten sein koennten. Diese zu „Indikatoren“ hochzustilisieren halte ich fuer unlauter, und Staedte auf Basis solch einer kruden und teilweise ausgewuerfelt wirkenden Bewertung in eine Rangliste einzugruppieren macht die Liste faktisch wertlos. Wir sollten ihr eigentlich keine Bedeutung beimessen. Insofern liefert sie aber letztlich dann doch fatale Indikatoren: Wie viele Entscheider:innen und auch Journalist:innen solch einen „Index“ gar nicht fachlich zu bewerten in der Lage zu sein scheinen und ihn fuer bare Muenze nehmen. Schade drum.

Lagenachbesprechung

There are these two young fish swimming along, and they happen to meet an older fish swimming the other way, who nods at them and says, “Morning, boys, how’s the water?” And the two young fish swim on for a bit, and then eventually one of them looks over at the other and goes, “What the hell is water?”

David Foster Wallace, 2005 Commencement Speech, Kenyon College

Das soll jetzt nicht falsch klingen, aber ich habe in der vergangenen Woche Freude aus einer Diskussion rund um eine Podcastfolge der „Lage der Nation“ gezogen. Zumindest in Deutschland endet nun Monat 11 der Pandemie, und mir fehlen tiefschuerfende Diskussionen sehr. Und nicht zuletzt gab es fuer mich einige Aha-Momente, die mich sehr an Diskurse rund um „Die Digitalisierung™“ erinnerten – und an welchen Stellen sie regelmaessig implodieren, weil verschiedene Seiten gar nicht ueber dieselbe Sache sprechen. Obwohl sie, oberflaechlich betrachtet, dieselbe Sprache sprechen.

Kernproblematik ist, dass wir auch nach Monat 11 der Pandemie immer noch nicht geschafft haben, die Bewaeltigung der Pandemie zu einer gesamtgesellschaftlichen Anstrengung zu machen, die wir als Kollektiv bewaeltigen, nicht als Ansammlung von Individuen. Derweil wird das kollektive Gedaechtnis, wie wir durch die Pandemie gehen, an vielen Stellen von Stimmen gepraegt, die vergleichsweise gut durch die Lage kommen, waehrend andere Perspektiven fehlen. Das ist ein Problem.

Ich finde leider die Originalquelle auf Twitter nicht mehr, aber ein Zitat in meiner Timeline lautete sinngemaess: „Es gab nie einen ersten Lockdown. Es gab privilegierte Menschen, die sich in ihr Zuhause zurueckgezogen haben. Und weniger privilegierte Menschen, die ihnen Essen geliefert haben.“

Solange diese Sichtweise den Diskurs praegt, haben wir auch nur eine einseitige Debatte (Dass die untereinander wieder viele Risslinien hat, spielt hier keine Rolle. Das Buergertum kann ja auch mal das Feeling mitbekommen, wie das ist, wenn in der eigenen Gruppe verschiedenste Stroemungen miteinander zoffen). Und das ist mir etwas zu wenig.

Impfprivilegien und Individualismus

Den Anfang macht der Podcast „Lage der Nation“, Ausgabe 225. In Kapitel 9 (Ab Minute 45:25) geht es um die Debatte, ob Geimpfte oder Genesene von bestehenden (oder noch kommenden) Beschraenkungen befreit werden sollen. Unter anderem wurde auch der Einwand beleuchtet, ob es nicht unsolidarisch sei, wenn nun Geimpfte und Genesene – platt gesagt – wieder tun duerften, was sie wollen. Die „Lage“-Sprecher verneinen das, im Gegenteil:

Also ich muss ganz ehrlich sagen, dieses Solidaritätsargument überzeugt mich nicht so wahnsinnig. Es ist, sagen wir mal, so ein Stück weit ein Fairness-Argument, solange der Staat tatsächlich die Prioritäten regelt und solange man sich eben nicht frei impfen lassen kann. Aber spätestens wenn Impfstoffe frei verfügbar sind, finde ich, ist Solidarität irgendwie kein wahnsinnig überzeugendes Argument. Da fand ich ganz spannend die Sichtweise von Carolin Emcke, Publizistin aus Berlin. Die hat das auf Twitter sehr schön auf den Punkt gebracht.
Wir zitieren das mal: „Als jemand, die vermutlich erst im Sommer geimpft wird, fallen mir keine vernünftigen Einwände ein, warum andere Menschen, die schon geimpft wurden, nicht auch wieder ins Theater oder ins Kino dürfen sollen. Ich gewinne doch nichts durch deren Verlust“.
Also auf Deutsch, so das Argument. Solidarität ist im Grunde ein Egoismus Argument, denn man selber, man selber verliert ja nichts dadurch, dass die anderen was mehr dürfen. Man muss vielleicht einfach mal den anderen Menschen gönnen, dass sie in gewisser Hinsicht Glück gehabt haben.

Ulf Buermeyer, Lage der Nation 225 (automatisches Transcript)

tante schrieb daraufhin eine Replik – „Lagebesprechung” – in der er die Argumentation Banses und Buermeyers analysiert und insbesondere die Praemissen nochmals gesonders aufzuzeigen versucht, die die beiden als Gegeben voraussetzen. Insbesondere verweist er darauf, dass die Geimpften und Genesenen nicht im luftleeren Raum stehen: Wenn Menschen ins Restaurant oder Theater gehen moechten, bedarf es dafuer wiederum weiterer Menschen, die das Essen kochen und servieren und Tickets abreissen und dergleichen mehr.

tante fuehrt (IMO zu Recht) aus, dass durch die Wiederherstellung des vorpandemischen Normalzustands „Immunkapital“ entsteht und dadurch materieller Druck bei eben diesen Essenskocher:innen und Ticketabreisser:innen, die in folgenden, naja, Optionen muendet:

Ich warte auf die Impfung und verliere meine Existenz/verarme

Ich versuche mir auf dem Schwarzmarkt ne Impfung zu kaufen

Ich versuche mir ein gefälschtes Immunzertifikat zu beschaffen

Ich infiziere mich willentlich und hoffe, nicht schlimm krank zu werden

Ich empfehle die Lektuere und bleibe solange hier.

Ich sehe was, was du nicht siehst

Kippfigur Rubinsche Vase
Kippfigur „Rubinsche Vase“. Je nach Betrachtung ist die Vase zu sehen, oder, naja, die unsichtbaren Arbeiter:innen, die sie fuellen sollen. Gemeinfreie Darstellung von John smithson 2007 via Commons

In der aktuellen „Lage“ 226 gehen Banse und Buermeyer ab Ca. Minute 45 auf tantes Blogpost ein und setzen ihm einige Entgegnungen gegenueber, die ich sehr spannend zu betrachten finde. Ein automatisiertes Transkript des Abschnitts findet sich hier.

Im Wesentlichen bringen die beiden die folgenden Argumentationsstraenge vor:

  • Die von tante bemaengelten unterschlagenen Praemissen seien sehr wohl in LdN225 vorgebracht worden.
  • tantes Argumentation, die Position der beiden spiegle ein sehr individualisiertes Rechts- und Gesellschaftsbild sei unzulaessig, da sie hier im Wesentlichen die Rechtslage wiedergeben wuerden, die genau auf solch einer Sicht aufbaue
  • Als Beispiel koenne man hier die Corona-Warn-App vorbringen, die das individuelle Recht auf Datenschutz hoeher haenge als moegliche gesellschaftliche Vorteile, wenn die von der App erhobenen Daten ueber Kontakte ohne Datenschutz freier verfuegbar gemacht werden wuerden
  • Generell sei die Argumentation mit Solidaritaet zwar menschlich nachvollziehbar, aber eben keine gueltige Argumentation sondern sogar gefaehrlich, weil man damit ja „alles“ begruenden koenne.

Auf die Geschichte mit der Warn-App einzugehen duerfte der muessigste Part sein. Die App ist seit Monaten nur ein weiteres Beispiel fuer den Versuch, durch vermeintlich ueberlegene technische Loesungen tatsaechlich soziale Probleme anzugehen – und dabei die eigentlichen Baustellen (z.B. umfassendes Track&Trace von Infektionen) links liegen zu lassen. Eigentlich war schon die App selber der Versuch, sich irgendwie Freiheiten zu erkaufen anstatt – solidarisch, fuer die gesamte Gesellschaft – die Pandemie komplett in den Griff zu bekommen. Die Debatte um mehr oder weniger Datenschutz in der App ist ein Strohmannargument, und die Unterstellung, dass tante sich ja sicher auch empoeren wuerde wenn man den Datenschutz in der App aufweichen wuerde ist besonders lustig wenn man tantes Geschichte kennt.

Interessanter ist die Behauptung, dass die beiden sehr wohl in LdN225 notwendige Praemissen vorgebracht haetten. Sie seien naemlich davon ausgegangen, dass es dann genuegend Schnelltests geben muesse, um nachweisbar Nicht-Infektioese den Geimpften gleichstellen und damit auch ihnen Dinge ermoeglichen zu koennen. Witzig ist hier, im Transkript darauf zu achten, wer daraus welche Schluesse zieht. Banse sagt:

Ja, wenn denn Geimpfte/Genesene in ein Restaurant gehen dürfen, dann geht das nur unter der Voraussetzung, dass die, die da arbeiten, einen Schnelltest kriegen

waehrend Buermeyer das „Freitesten“ auf eine Gleichstellung mit denjenigen Geimpften bezieht, die sich dafuer entscheiden koennen, zum Beispiel ein Restaurant oder ein Theater zu besuchen.

Beide Faelle beschreiben aber eine komplett unterschiedliche Argumentation, und das ist nicht nur akademisch interessant. Wenn wir im Alltag eine Argumentation vorbringen, fangen wir nie bei Null an. Wir gehen davon aus, dass wir gewisse Grundannahmen mit dem Gegenueber teilen. Zwar ist es theoretisch moeglich, buchstaeblich bei Null anzufangen, wie das in der Mathematik-Grundvorlesung mit Null- und Einselement der Fall ist, auf denen dann quasi alles Folgende abgebildet wird. In alltaeglichen Diskussionen macht man sich damit keine Freund:innen (es sei denn, es ist schon spaet und man trifft in der Kueche Menschen, die wirklich sehr viel Spass an Aussagenlogik haben, was ich hier keinesfalls schlechtreden moechte). In der Praxis wird man sich daher vielfach auf Enthymeme stuetzen, also auf Praemissen, bei denen man annimmt, dass die an einer Diskussion Teilnehmenden sie allgemein anerkennen. Die haben auch den geschickten Vorteil, dass sie einem – weil sie ja allgemein anerkannt sind – bei der Argumentation tatsaechlich helfen.

Es lohnt sich aber durchaus, diese Annahmen einmal gezielt zu dekonstruieren. tante erwaehnt – leider – in seinem Blogpost kein einziges Mal den Begriff „Klasse“. Und der – und die damit verbundenen Praemissen, die man jeweils als allgemein anerkannt annimmt – machen in der Diskussion den grossen Unterschied.

Denn, und damit sind wir beim individualisierten vs. kollektivistischem Gesellschaftsbild angelangt, Freiheit ist nicht eindimensional. Freiheit erschoepft sich nicht in der positiven Freiheit, selber (als geimpfte, genesene oder sei es nur risikobereite Person) zu entscheiden, ein Theater oder ein Restaurant zu besuchen. Zu ihr zaehlt auch die negative Freiheit, nicht durch Dritte dazu gezwungen zu werden, sich einem Risiko auszusetzen, dem man sich nicht aussetzen moechte.

Und hier clashen die Weltbilder. Banse und Buermeyer scheinen sich hauptsaechlich in einer Welt der positiven, individualistischen Freiheit aufzuhalten, in denen externe nicht allein im Recht begruendete Einfluesse selten sind. Keinem von beiden scheint aufzufallen, dass erst durch die Oeffnung von Restaurants oder Theatern eine Situation geschaffen wird, in denen bislang nicht gegen die Pandemie immune Menschen aus wirtschaftlichen Zwaengen letztlich dazu gezwungen werden koennten, sich dem Pendelverkehr im oeffentlichen Personenverkehr auszusetzen, nur um Geimpften und Genesenen das Essen an den Tisch zu bringen. Einen Schnelltest kann man unter diesen Bedingungen fast schon fuer zynisch halten – wir werden wenigstens herausfinden, wenn wir dich als Servicekraft dazu gebracht haben, dich tatsaechlich zu infizieren. Vielleicht findet das Gesundheitsamt dann ja auch raus, ob du daran beteiligt warst, durch deinen eigentlich vollkommen unnoetigen, nur den Menschen mit Immunkapital dienenden Aufenthalt in einer Risikozone dazu beigetragen hast, eine moeglicherweise noch verheerendere Mutante des Virus zu verschaerfen. Oder ob nur du und dein direktes Umfeld in Lebensgefahr gebracht wurden.

Kippfigur. Sieht von unten anders aus als von oben.

Sind hier 6 oder 7 Wuerfel zu sehen? Novi Sad um 1910. Locksit, Kippfigur 6=7 Wuerfel, CC BY-SA 4.0

Das alles waere eigentlich muessig zu diskutieren, wenn die „Lage“ nicht mittlerweile so ein reichweitenstarker Podcast geworden waere, der nicht wenig zur Meinungsbildung zumindest in podcastaffinen Bildungsbuergerkreisen beitragen duerfte. Es gibt derzeit kaum Medienjournalismus, der die Inhalte in reichweitenstarken Podcasts bespricht, und mangels Transcripts ist das auch gar nicht so einfach. Nicht zuletzt aber tat sich die Lage – sicherlich auch wegen des beruflichen Backgrounds von Buermeyer als Jurist – auch in der Vergangenheit dadurch hervor, vorwiegend aus der geltenden Rechtslage heraus Sachverhalte zu argumentieren. Das faengt schon mit der – fehlgeleiteten – Analyse an, was eigentlich Privilegien im rechtlichen Sinne seien.

Gesetze sind aber vor allem gesellschaftliche Konstrukte, die naturgemaess aus existierenden Herrschaftsstrukturen erwachsen. Es gibt keinen Punkt, an dem eine Gesellschaft „fertig“ ist. Was wir heute fuer selbstverstaendlich halten, war noch in der Generation unserer Eltern hart umkaempft. Und fuer manches, was heute Stand der Gesetzgebung ist, wird die nachfolgende Generation uns irritiert den Vogel zeigen. Dieses Bewusstsein, dazu das Anerkenntnis, was „hart umkaempft“ tatsaechlich in der Praxis bei vielen gesellschaftlichen Veraenderungen wirklich bedeutete, und die stetige Dekonstruktion der eigenen Position und Annahmen (gerne bis hin zu dem eher unangenehmen Part, wo mensch auch die Praemissen dekonstruiert, auf denen Teile der eigenen Persoenlichkeit begruendet sind) taeten einer Lage der Nation schon gut.

‘We Shall Overcome’ is a song which, in various languages, is common on every known world in the multiverse. It is always sung by the same people, viz., the people who, when they grow up, will be the people who the next generation sing ‚We Shall Overcome’ at.

 Terry Pratchett, Reaper Man

Keine einfach-so-Lizenzen fuer Datensaetze

Ich sitze gerade an einer internen Handreichung fuer die Bereitstellung von Open Data, und bin dabei wieder ueber die Unsicherheiten von Menschen im oeffentlichen Dienst gestolpert, welche Lizenz man denn fuer Open Data verwenden solle.

Das Problem ist: Eigentlich ist die Frage schon falsch. Denn die auf dem Urheberrecht aufbauenden Lizenzen sind ueberhaupt nur anwendbar, wenn es sich bei dem zu lizenzierenden Material um Werke im Sinne des Urheberrechts handelt, oder Datenbankherstellerrechte bestehen. Das duerfte aber regelmaessig bei reinen Faktendaten nicht der Fall sein, insbesondere nicht bei Messdaten.

Leider hat sich – vermutlich auch durch das ueber die Jahre entstandene Erklaermaterial, das gerne auch einfach mal CC-BY-Lizenzen hierfuer vorsieht – die Vorstellung in den Koepfen verfestigt, dass man Lizenzen „einfach so“ anwenden koenne, ohne dass hierfuer irgendwelche Voraussetzungen erfuellt sein muessen. Umso schlimmer wurde das durch die „Datenlizenz Deutschland“, die gar nicht erst offenlegt, auf welcher Rechtsgrundlage sie anwendbar sein soll (siehe, siehe auch).

Ich hatte hier im Blog letztes Jahr schon argumentiert, warum ich diesen Automatismus „Daten als Open Data herausgeben → beliebige Lizenz im Sinne der Open Definition anwenden“ bzw. die Frage „wem gehoeren die Daten“ fuer gefaehrlich halte. Und dass an den Anfang der Entscheidung die Frage gehoert, ob hier Urheberrechte vorliegen – weil wenn nein, gehoert als Label schlicht die CC-0 drauf, und gut ist.

Jochen vom OK Lab Berlin machte mich gestern auf zwei Schriften aus dem Open-Science-Umfeld aufmerksam, die zur Unterfuetterung dieser Argumentation gut geeignet sind, und die ich bislang noch nicht kannte.

Die Kurzform ist das Fact Sheet on Creative Commons and Open Science (2017). Sehr viel ausfuehrlicher ist „Rechtsfragen bei Open Science“ von Till Kreutzer und Henning Lahmann (2019), die detailliert am UrhG entlang die Rechtslage aufzeigt und auch in mehreren Kapiteln auf FAQ zu bestimmten Aspekten eingeht. Zielpublikum ist zwar eigentlich ein akademisches, das mit Forschungsdaten umgeht. Der Transfer auf Daten der oeffentlichen Hand sollte aber nicht schwer fallen.

Der Antiberblingercontest

Vor 250 Jahren wurde Albrecht Ludwig Berblinger alias „der Schneider von Ulm“ geboren, und die Stadt nahm sich das zum Anlass, dieses Jahr eine richtig grosse Sause zu schmeissen.

Undatierter Kupferstich des Flugversuchs Berblingers an der Adlerbastei in Ulm. Stadtarchiv Ulm. Gemeinfrei.

Berblinger, kurz zusammengefasst, baute Anfang des 19. Jahrhunderts einen ersten Haengegleiter, mit dem er Flugversuche unternahm – also Jahrzehnte vor Otto Lilienthal. In den Weinbergen am Michelsberg funktionierte das offenbar relativ gut, und irgendwann bekam er die Aufmerksamkeit vom damaligen Koenig von Württemberg, der seine Versuche daraufhin finanzierte.
Als der Koenig in der Stadt weilte, sollte Berblinger dem Finanzier seinen Apparat vorfuehren, aber diesmal vom Ufer der Donau aus. Berblinger kannte zwar den Begriff Thermik wohl nicht, war sich aber offenbar unsicher ob der „Fliegekraft“ ueber dem kalten Fluss und der Abwinde an der Stadtmauer. Ob am Ende wirklich ein Polizeibuettel den zoegernden Berblinger fuer das ungeduldige Publikum von der Adlerbastion schubste oder nicht – Berblinger stuerzte steil in die Donau, wurde sozial ausgestossen, starb verarmt.

Die Stadt nahm sich fuer das Berblingerjahr vieles vor, und manchem davon begegnete ich auch ein paar mal in der Planung. Ein Part – alles ausgedacht vor Covid-19 – ist der Test Test Contest: Menschen sollen Ideen fuer „Innovation“ einreichen und sollen diese dann in der letzten Auswahlrunde einer Jury vorstellen und diese ueberzeugen und dann winken Preisgelder.

Kommt einem bekannt vor, das Konzept, nicht? Ich war nicht so furchtbar angetan davon – meine Meinung zu Innovationswettbewerben mit Preisen und Jurys duerfte bekannt sein. Ein besonders kratzender Miss-Ton war fuer mich vor allem der krasse Widerspruch zwischen der Moral oder Pointe oder Botschaft der Berblinger-Story und dem Hoehle-der-Loewen-Konzept.
Auf der einen Seite steht ein Erfinder, der seiner Zeit voraus war und verlacht und verarmt starb – weil er nicht die Zeit und den Raum bekam, seine Forschung weiterzutreiben und ausreichend gut zu verstehen. Sondern es sollte einen, hm, Pitch zu vorgegebener Zeit und nach den Bedingungen des Geldgebers geben, und das ging dann in die Hose oder die Donau. Und auf der anderen Seite gibt es dann einen Contest, der genau das typische Geldgeber-Pitch-Format umsetzt.

Naja. Ich hatte damals dieses schiefe Bild erwaehnt, aber ich hatte offen gestanden auch ueberhaupt keine bessere Idee, wie man das anders machen koennte. Der Contest ist mittlerweile vorbei, und heute hatte ich mit einem der Beteiligten gequatscht, der auch ein wenig kritisch war. Danach diskutierte ich weiter mit @gruenzeug drueber, passenderweise als wir den zum Aktionsjahr aufgebauten Berblingerturm hochstiegen. Und vielleicht auch, weil @joliyea gerade ein „richtiges“ Hackathon-Handbuch aus Sicht von Digitalem Ehrenamt und Verwaltung schreibt, an dem ich gerade ein wenig mitschreibe, machte es auf einmal Klick. Was ich gerne mal stattdessen haette: Ein Pitch oder wie auch immer man das nennt, wo spannende Ansaetze vorgestellt werden. Und es am Ende aber nicht darum geht, die einzelnen Projekte mit Geld und Ruhm zu bewerfen. Sondern die Projektgruppen sollen umreissen, was es als lokale Stadt- (oder gar Land-!)gesellschaft an gemeinsamer, niedrigschwellig zugaenglicher Infrastruktur braeuchte, um diese Idee voranzutreiben. Und die fachkundige Jury kann sich gerne noch weitere Aspekte ausdenken, die es als oeffentlich zugaenglichen Service geben soll.

looniverse, Berblinger-Turm 6, CC BY-SA 4.0

Ich bin mittlerweile lang genug in dem Geschaeft um zu wissen, dass 15.000 EUR an Einzelgruppen ausschuetten im Vergleich ultra einfach ist, und oeffentlich zugaengliche Infrastruktur bereitzustellen verdammt teuer und aufwaendig ist.
Aber manchmal braucht es halt einfach Ausdauer und langen Atem. Anstelle des metaphorischen ungeduldigen Polizeibuettels, der die Erfindung vor ihrer Zeit in die Donau stoesst. Und man stelle sich mal vor, was da alles bei rauskommen koennte. Wenn man nicht nur einzelne Projekte mit Geld bewirft (was abrechnungs- und steuertechnisch nicht selten eine Huerde und einen Ausschlussfaktor fuer sich darstellt) sondern wenn am Ende die gesamte Stadtgesellschaft mehr Zugang zu Dingen hat, mit denen sich Tolles, Spannendes und vielleicht auch einfach nur Schoenes schaffen laesst.

PS. Im Januar stiess ich auf diesen spannenden Bericht ueber die Donau-Ueberquerung per Heissluftballon durch Madame Bittorf. Die Madame – ueber die erstaunlich wenig bekannt zu sein scheint – schaffte im Berblinger-Donauabsturzjahr 1811, was der Schneider von Ulm nicht schaffte, naemlich einen Flug (okay, eine Fahrt) ueber die Donau, im Ballon.

The Design Industrial Complex

Mehrere kritische Blicke auf Human Centered Design und Design Thinking. Einerseits sowieso kritisch zu hinterfragen weil Cargo Cult (und Meta: Ich haette gerne einen besseren, nicht auf westlicher herabschauender Sicht basierenden Begriff dafuer).

Andererseits die Diskussionsthese:

Antworten darauf:

Design for systems, not users. The unintended consequences of user-centered design (via @alexislloyd, Autorin des Artikels)

As a designer, I try to look at both the explicit and implicit choices being made in designing an experience. And the implicit choices baked into much of our software are deeply problematic, creating shiny user experiences on top of extractive and exploitative business models. As I think through how we might make more ethical choices, how we might make those implicit choices explicit, I’ve found myself looking critically at the practice of user-centered design. The fundamental problem is this:
User-centered design focuses attention on consumers, not societies
[…]
As Kevin Slavin writes in his essay Design as Participation, “When designers center around the user, where do the needs and desires of the other actors in the system go? The lens of the user obscures the view of the ecosystems it affects.”

So in effect, user-centered design ends up being a mirror for both radical individualism and capitalism.

“Design Thinking”: Defending Silicon Valley at the Apex of Global Labor Hierarchies (via @NCResq):

A “design thinker” promises insights, new markets, and aesthetic judgment, like a divining rod leading to new markets or domains of life ripe for intervention. Those who possess cosmopolitanism ─ an affable, empathic rapport with consumers and corporate executives alike ─ can promise value in these worlds. Those whom clients, investors, and immigration interviewers read as the right kind of cosmopolitan, even if not white, read as citizens of Pink’s “conceptual age.” These are the racialized people whom Mark Zuckerberg defends when he defends the DREAM Act. These are the immigrant startup founders the US Department of State sought to recruit under Obama-era start-up promotion laws. These are the very same racialized start-up founders Steve Bannon, former Trump strategist, said overpopulate executive roles in Silicon Valley. Economic nationalism depends on hierarchies of race and economic practice to mobilize people in the name of whiteness and economy. Bannon shows the iron hand of this logic and IDEO the velvet glove.
[…]
On its face, design thinking appears as a form of engineering that integrates feminized rationalities of storytelling and empathy. Yet to treat design thinking as a feminist practice ignores the global divisions of labor and distributions of value that make this sensibility of touching, feeling, and making valuable and effective

Ergaenzt wurde das neulich durch einen Linktipp von @bumblblu: On Design Thinking

Design means something even broader now. Sometime around World War II, it came to mean making things that “solve problems.” With the influence of mid-century global social movements and the rise of digital technology, it began to mean making things that are “human-centered.” And as of recently, design doesn’t have to involve making things at all. It can just mean a way of thinking.
[…]
To be a design thinker, then, is to see a hospital-shift change and a guerrilla war as design problems. It is to see “design,” whatever the word might mean, as applicable to just about anything. But even as “design thinking” rendered “design” yet more capacious ,  it also jettisoned the self-conscious suspicion of “methodology” at which designers, following Horst Rittel, had arrived in the ’60s. Design thinking was unambiguously a recipe, a formula, a five-step program. The stories of Kaiser and Colombia are stories of a defined and tidy linear process, a jaunt from one colored hexagon to the next.
It was design for a service economy: memorable, saleable, repeatable, apparently universal, and slightly vague in the details.
[…]
This is what worries me about design thinking: its colossal and seductive promise. There was an earlier Anglo-American vogue for design — a love affair with industrial design, beginning in the Depression era — but it was relatively benign in its claims and its outcomes. This more recent vogue for design thinking seems more insidious because it promises so much more. It promises a creative and delightful escape from difficulty, a caper through the Post-it Notes to innovative solutions. And it promises this as a service, delivered at what is often great cost — not just to IBM and Intuit and Starbucks, but to villages and nonprofit organizations and cities like Gainesville without enormous resources to spare.

Von @bumblblu kam auch die Inspiration fuer die Artikelueberschrift: Design Thinking, Zettelkleben und Co. sind zu einem „design industrial complex“ geworden. Oder wie es @lorz in anderem Kontext ausdrueckte: „ahnungsloser regierungsnaher Kluengel“.

Anti Datenportal Ultras

Immer wieder begegne ich Diskussionen, dass man zum Bereitstellen offener Daten erst einmal ein „Datenportal“ brauche (wahlweise auch eine „Datendrehscheibe“ oder sonstwas; ich schlage fuer das neue Buzzword „Datenraum“ gleich mal vorsorglich hier den Begriff „Datenraumfahrtbahnhof“ vor).

Wasserturm, ehemalige Wiley Barracks in Neu-Ulm
Martavictor, Wasserturm, ehemalige Wiley Barracks in Neu-Ulm, CC BY-SA 4.0

Dieses Vorgehen stellt die Kausalitaet aber auf den Kopf. Das ist so, als wolle man irgendwo im Schrebergarten neben dem Acker eine Moeglichkeit zum Haende waschen und Pflanzen giessen haben, und anstatt mal einen Brunnen zu bohren, plant, konzipiert und baut man einen sehr komplizierten Wasserhochbehaelter. Sobald der dann fertig ist und die ersten Datens^wEimer voll Wasser haendisch reingeleert wurden, faellt dann aber auf, dass es immer noch keinen Brunnen gibt – oder gar eine Pumpe, mit der der Hochbehaelter automatisch gefuellt werden koennte.

Die umgekehrte Vorgehensweise ist die zielfuehrendere: Wenn ich einen Brunnen bohre und erst einmal eine einfache Handpumpe montiere – kann ich meine Haende waschen und die Tomaten giessen. Ziel erfuellt. Ich kann spaeter eine Solarpumpe, einen einfachen Pufferbehaelter oder ein Hauswasserwerk, eine Wasseraufbereitung, eine Klaerstufe, alles moegliche nachruesten, und vor allem auch Dinge durchautomatisieren. Aber die wesentliche Funktion, zu deren Zweck ich das alles gemacht habe, wurde von Anfang an erfuellt.

Und wenn ich mitgedacht habe, habe ich auch auf genormte Anschluesse und flexibel umsteckbare Schlauchsysteme gedacht, falls sich spaeter mal meine Ansprueche aendern.

Um die Metapher mit Leben zu fuellen, reicht ein Blick auf https://gtfs.mfdz.de. Die Seite sieht aus als sei sie auf Geocities gehostet, aber das macht nichts, denn sie ist momentan eine der besten Quellen, um in Deutschland an offene Fahrplandaten zu kommen. Die werden naemlich derzeit an ganz verschiedenen Stellen veroeffentlicht – teilweise ganz einfach auf einer Website aufgelistet, teilweise in einem eigens eingerichteten Datenportal, und teilweise immer noch nur fuer registrierte Nutzer:innen. Letzteres ist aus DSGVO-Sicht spannend, und der Sinn nicht ganz klar – denn als Open Data duerfen sie natuerlich auch gemirrort werden. Oder man baut eben einen URL-Shortener, der nichts anderes tut, als auf das aktuelle ZIP-File zu linken. Naja.

Allen Menschen mit Ambitionen fuer Datenportale kann man derweil nur sagen: Scheut euch nicht, eure Daten einfach in genau so einem Stil herauszugeben. Steckt lieber Energie in automatisierte Bereitstellung, oder passende Prozessketten, die so wie hier auch gleich Berichte ueber Probleme und Fehler automatisiert mit bereitstellen. Wenn Daten das neue Grundwasser sind, dann ist eure Aufgabe, die Daten moeglichst einfach und automatisiert sprudeln zu lassen – und sich dann an den Wasserturm zu machen.

Ein paar Gegenfragen zur Frage „wem gehoeren die Daten?“ (Kurze Antwort: Niemandem. Und das ist auch gut so.)

Vielleicht ist das nur ein subjektiver Eindruck, oder ich reagiere darauf mittlerweile staerker, aber mir begegnen gefuehlt immer haeufiger beilaeufige Bemerkungen oder Fragen dazu, „wem die Daten gehoeren“. Beispielsweise bei der Frage, wer die Veroeffentlichung irgendwelcher Messdaten als Open Data freigeben koenne, „weil die Daten ja XY gehoeren“. Oder aber auch als vermeintliches Argument fuer technologische Souveraenitaet: Die oeffentliche Hand soll Dienste selbstbestimmt anbieten anstatt sie dem freien Markt ueberlassen, „weil dann gehoeren die Daten der IoT-Sensorik am Ende der Stadt, anstatt privatwirtschaftlichen Akteuren“.

Es ist wichtig, dass wir alle solche Bemerkungen immer und konsequent hinterfragen, wenn wir ihnen begegnen. Gerade die zweite Form ist naemlich eigentlich eine fast schon witzige Verdrehung dessen, was passiert ist: Privatwirtschaftliche Akteure haben sehr lange versucht, ein in der Realitaet gar nicht existierendes Eigentumsrecht an Daten in unsere Alltagssprache zu verankern – und indem wir ein Gegenmodell zur Privatisierung von Daten fordern, verbreiten wir ungewollt das Maerchen vom Dateneigentum.

Denn es ist vollkommen egal, ob oeffentliche Hand, Privatperson oder Wirtschaft: Daten (und hier meine ich insbesondere automatisiert erfasste Messdaten, aber auch schiere Faktendaten) koennen niemandem „gehoeren“. Und das ist auch gut und richtig so. Ein „Eigentum“ an Daten wuerde bedeuten, dass ich mit meinem Thermometer die Aussentemperatur messen und dann Dritten verbieten koennte, diesen Temperaturwert an andere weiterzugeben, nachdem ich ihn verraten habe. Und das waere fatal. Genausowenig kann und darf irgendwer mir verbieten oder nur unter bestimmten Auflagen erlauben, weiterzuerzaehlen, dass 768 Stufen aufs Ulmer Münster führen – auch wenn ich das aus einem (insgesamt urheberrechtlich geschuetzten) Buch oder der Wikipedia weiss (siehe auch).

Tatsaechlich kann die Verwertung und Verbreitung von Daten durch Dritte nur unter ganz bestimmten Bedingungen eingeschraenkt werden – beispielsweise aufgrund datenschutzrechtlicher Bestimmungen, meist aber aufgrund des Urheberrechts. Und nachdem sich neben des Begriffs des Dateneigentums auch die Annahme eingeschlichen hat, dass man Lizenzen (also Bedingungen und Einschraenkungen, zu welchen Konditionen Daten verarbeitet oder weiterverbreitet werden duerfen) einfach so anwenden kann (hier ist beschrieben, warum dem nicht so ist), halte ich es fuer ueberfaellig, diese Annahmen durch gezielte Nachfragen bei jeder Gelegenheit einem Realitaetscheck zu unterziehen.

Beispielfragen, die mir bislang eingefallen sind (und die ich bislang nie in exakt diesem Script abgespult habe, weil ich kein sadistischer Quaeler bin):

  • Was meinen Sie mit „gehoeren“?
  • Auf welcher genauen Rechtsgrundlage soll hier die Nachnutzbarkeit durch Dritte eingeschraenkt werden koennen?
  • Ich meine, auf welcher Rechtsgrundlage soll hier die CC-BY-Lizenz verbindlich gemacht werden koennen? Warum soll ein Dritter hier zur verbindlichen Namensnennung verpflichtet werden koennen?
  • Sie sagen schon wieder „gehoert“ – es gibt doch gar kein Eigentumsrecht an Daten, sondern nur bestimmte Immaterialgueterrechte. Bauen Sie hier auf das Urheberrecht auf?
  • Nach welcher Argumentation handelt es sich denn um ein geschuetztes Werk? (vgl. Kapitel 2.6 dieses Abschlussberichts, inline PDF)
  • Aber Faktendaten sind doch gar keine individuelle schoepferische Leistung (PDF), weswegen sollte hier ein Schutz nach § 2 Abs. 2 UrhG vorliegen?
  • Aber das Datenbankurheberrecht nach § 4 UrhG schuetzt doch nur die Form und Anordnung, nicht die Daten selbst. Und ueberhaupt: Ist die Anordnung der Daten hier wirklich eine schoepferische Leistung?
  • Sind Sie sicher, dass fuer das Live-Ausspielen eines aktuellen Messwerts Datenbankherstellerrechte nach §§ 87a ff. UrhG anwendbar sind?
  • Selbst wenn es so ein Eigentum gaebe: Wie wuerden sie das durchsetzen wollen? (PDF)
  • Kennen Sie das Gutachten der Justizministerkonferenz (PDF), dass ein Dateneigentum ueberhaupt nicht sinnvoll waere und oekonomisch keinen Nutzen haette?

Mit solchen (freundlich verpackten) Fragen bekommen wir hoffentlich bald sowohl die Idee vom Dateneigentum wie auch die Annahme von der Anwendbarkeit von „Datenlizenzen“ als magische Zaubersprueche etwas geradegerueckt. Interessanterweise scheint solche Fragen vor allem auf C-Level-Entscheiderebenen sonst kaum jemand zu stellen.