Die Datenlizenz Deutschland gehoert auf den Muell. Jetzt.

Leider schwappt mir der Unsinn gerade wieder auf den Schreibtisch, obwohl ich eigentlich gerade eine coole Veranstaltung mitzugestalten habe. Mittlerweile ist die Geduld aber einfach am Ende.

Worum es geht: Die sogenannte Datenlizenz Deutschland. Die wurde 2013 zu unklaren Kosten als nationale Sonderloesung entwickelt und war in der ersten Version einfach vollkommen inkompatibel zu allen bestehenden Lizenzen und fuer Open Data schlicht ungeeignet, was auch direkt zu umfangreicher Kritik fuehrte. Nicht nur war sie vollkommen schwammig und unklar formuliert, sie erlaubte auch eine „Freigabe“ von Daten nur zu nichtkommerziellen Zwecken. Dieses Prinzip ist auch bei den Creative-Commons-Lizenzen hochproblematisch (und gehoert eigentlich auch abgeschafft, naja).

Auf die Kritik hin wurde im weiteren Verlauf eine Version 2.0 geschaffen, die nur mehr die Varianten Zero (Kennzeichnung als gemeinfrei bzw. in der Konsequenz der Rechtedurchsetzung damit gleichzusetzen) und obligatorische Namensnennung vorsah. Und leider wirkte die zivilgesellschaftliche Beteiligung daran, den kolossalen Unsinn der Version 1.0 geradezubiegen, wohl so, als wuerde man diesen unnoetigen nationalen Alleingang billigen. Obgleich beispielsweise die OKF ausdruecklich schreibt:

Wir haben immer, ausdrücklich und grundsätzlich von der Schaffung einer nationalen Open-Government-Data-Lizenz abgeraten und tun das auch weiterhin. Wir freuen uns zwar sehr, dass die Daten-Deutschland-Lizenz 2.0 jetzt konform mit der Open Definition ist, als Insellösung ist es aber natürlich nur die zweitbeste Lösung. Die erstbeste Lösung ist und bleibt natürlich die Verwendung der offenen Versionen der Creative Commons Lizenz.

https://okfn.de/blog/2014/09/erfolg-fuer-open-data-datenlizenz-deutschland-version-2-0-ist-eine-offene-lizenz/

Nun sind fuenf Jahre vergangen, und der langfristige Flurschaden der unnoetigen sogenannten Datenlizenz Deutschland wird deutlich. Wer beispielsweise auf govdata.de nach Datensaetzen unter DL-DE Namensnennung sucht, duerfte etwas erstaunt sein. Finden sich dort doch beispielsweise CSV-Listen von Projektstandorten. Oder Auflistungen von AbsolventInnen nach Kreisen. Oder Umsaetze von Unternehmen.

Und jetzt mal bloed gefragt: Warum genau sollte mich die Lizenz in diesen Faellen zur Nennung der Quelle verpflichten koennen? Die Creative Commons erklaeren in ihrer FAQ, dass ihre Lizenzen – genau wie Freie Softwarelizenzen – das Urheberrecht nutzen, um genau dann, wenn es sich um ein urheberrechtlich geschuetztes Werk handelt, per Standardvertrag die Nachnutzung (Verbreitung, Vervielfaeltigung, etc) explizit und unter bestimmten Bedingungen zu erlauben. Und weil das bei Creative Commons auch handwerklich gut durchdacht und gemacht ist, besteht die Lizenz aus drei Schichten: Der Kurzfassung fuer Laien, einer maschinenlesbaren Fassung, und einer ausfuehrlichen Fassung fuer JuristInnen, die auf die Details und die rechtlichen Grundlagen der Lizenz eingeht. Wer Zweifel hat, kann also in der Langfassung herausfinden, ob diese Lizenz ueberhaupt fuer einen Datensatz Anwendung finden kann, oder ob ein so lizenzierter Datensatz auch in einem angenommenen Spezialfall genutzt werden kann.

Die Datenlizenz Deutschland besteht dagegen nur aus der Kurzfassung. AnwenderInnen wird nicht klargemacht, dass die Namensnennung-Version ueberhaupt nur benutzt werden kann, wenn es sich beim zu lizenzierenden Datensatz um ein urheberrechtlich geschuetztes Werk handelt. Und so schleicht sich nun seit fuenf Jahren offenbar die Ansicht in die oeffentliche Verwaltung, dass es sich bei Datenlizenzen nicht etwa um Standard-Vertraege auf Basis des Urheberrechts handelt, sondern um magische Zaubersprueche, die man ohne weitere Grundlage einfach so nur aussprechen muss, und dann muss jemand einen Herausgebernamen nennen. Das ist halt einfach Quatsch.

Unterstuetzt wird die Datenlizenz derzeit vor allem noch durch ein vom Land NRW in Auftrag gegebenes, von PWC erstelltes „Rechtliches Kurzgutachten“ vom Februar 2019, bei dem ich mich frage, ob daran wirklich JuristInnen beteiligt waren – und wenn ja, ob sie sich je zuvor mit Freien Lizenzen befasst haben. Aber das wird wohl demnaechst ein weiterer Blogpost werden muessen.

TL;DR: Die Datenlizenz Deutschland ist handwerklich schlecht gemacht. Sie haelt die oeffentliche Verwaltung in einem halbinformierten Zustand und sorgt reihenweise zu Schutzrechtsberuehmungen. Sie hat seit der Creative Commons 4.0 keine Daseinsberechtigung mehr und gehoert ersatzlos gestrichen.

6 Gedanken zu „Die Datenlizenz Deutschland gehoert auf den Muell. Jetzt.

  1. Bernhard Krabina

    Lieber Stefan,
    als Österreicher (und noch dazu Nicht-Jurist) habe ich nie verstanden, warum es eine eigene Lizenz benötigt. Aber abgesehen davon und abgesehen davon, dass die Welt natürlich ein paar Jahre später etwas anders aussieht, habe ich eine grundlegende Frage zu deinem Post:
    Wenn ich das richtig verstehe, kritisierst du die aktuellste Version der Datenlizenz Deutschland aus drei Gründen
    1. fehlende internatonale Kompatibilität (im Vergleich zu CC-Lizenzen
    2. zu wenig Detail, da nur Kurzfassung
    3. Problem, dass öffentliche Stellen diese Lizenz auf Dinge anwenden, die gar nicht dem Urheberrecht unterliegen.

    Mich interessiert insbesondere der 3. Punkt: weil hier sehe ich keinen Unterschied zu CC-Lizenzen, insbesondere weil du due Public-Domain-Mark nicht erwähnst. In Österreich ist das nämlich genauso: die Behörden stellen Daten unter eine CC-BY-4-0-Lizenz und niemand kümmert sich darum, ob diese Daten überhaupt dem Urheberrecht unterliegen oder als amtliches Werk eigentlich gemeinfrei sein müssten. Das wurde lediglich beim Rechtsinformationssystem (RIS) mal geprüft. Da es sich dabei um Gesetzestexte handelt, ist es dort eindeutig, dass es sich um „amtliche Werke“ handelt, die nicht Lizenzierbar sind, sondern eben gemeinfrei. Wie das bei einem Baumkataster ist, hat offenbar in Österreich auch noch niemand ausjudiziert. Die juristischen Gutachten dazu sind leider kaum vorhanden.

    Mein Argument ist daher: die Frage, ob Daten überhaupt CC0 oder CC-BY-lizenzierbar sind ist ebenso zu sehen wie ob sie mit der Datenlizenz Deutschland (Zero oder BY) lizenzierbar sind. Es gibt daher da keinen Unterschied mit Ausnahme der „Public Domain Mark“, die von der CC aus genau diesem Grund eingeführt wurde.

    Oder siehst du das anders?
    lg, Bernhard

    Antworten
    1. stk Beitragsautor

      Danke fuer die Rueckfrage! Zu 1 koennte man ergaenzen, dass es eigentlich ja nur zwei Moeglichkeiten gibt: Entweder ist die DL-DE beliebig austauschbar zu CC BY (bzw Zero) einsetzbar – aber warum sollte es sie dann ueberhaupt geben? Oder sie ist etwas anderes, und dann ist sie inkompatibel.

      2 und 3 gehoeren fuer mich zusammen. Zusammen sorgen sie dafuer, dass es fatale Wissens- und Kenntnisluecken gibt, wann genau ueberhaupt Lizenzen verwendet werden koennen und wann es sich bei den Zero-Lizenzen um rein deskriptive Hinweise handelt, dass es hier um nicht schuetzbares Material geht. Du hast mit der Public Domain Mark noch eine weitere Variante hinzugebracht, die ich ein wenig unterschlagen habe. Wenn man so feingliedrig wird, gibt es praktisch drei Varianten:

      a. Material, auf das Schutzrechte nach UrhG anwendbar sind und fuer das Namensnennung gewuenscht ist → CC BY
      b. Material, auf das Schutzrechte nach UrhG anwendbar sind und das vom Rechteinhaber als mit gemeinfreiem Material gleichzusetzen freigegeben wird → CC 0
      c. Nicht schuetzbares Material (z.B. wegen mangelnder Werkqualitaet, mangelnder Urheberpersoenlichkeit oder als amtliches Werk) → Public Domain Mark

      Ich habe so gesehen die Faelle b und c zusammengeworfen und nicht unterschieden, wann es eine explizite Freigabe ist und wann es sich um eine deskriptive Auszeichnung nicht schuetzbaren Materials handelt – insofern also selber unsauber, ups.

      Mein Problem ruehrt nun daher, dass ich, wenn ich Leuten freie Lizenzen beibringe, immer aus der Dreigliedrigkeit der CC-Lizenzen mit dem juristischen Text und der Einordnung in das zugrundeliegende Rechtsregime (UrhG und US Copyright Act, Unterschiede davon und wie das in die CC 4.0 passt) herleite. Dieser Unterbau fehlt der DL-DE vollkommen bzw. besteht nur sehr implizit oder aber es weiss am Ende sogar bei den Herausgebern niemand so genau (das NRW-Gutachten verleitet etwas zu diesem Schluss). Deswegen halte ich sie auch fuer handwerklich schlecht gemacht.

      Dass die Ausbildung diesbezueglich in der oeffentlichen Verwaltung immer noch eine kolossale Shitshow ist, ist nicht Schuld der DL-DE. Aber sie traegt halt ihren Teil dazu bei.

      Antworten
  2. Pingback: Das pwc-Gutachten fuer NRW zur Datenlizenz Deutschland | stk

  3. Pingback: Ein paar Gegenfragen zur Frage "wem gehoeren die Daten?" (Kurze Antwort: Niemandem. Und das ist auch gut so.) | stk

  4. Pingback: Keine einfach-so-Lizenzen fuer Datensaetze | stk

  5. Pingback: Open Data, wie es zu Covid haette sein koennen | stk

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert