Linked Open Data mit CSVW und fuer Ratsprotokolle

Zwei Fundstuecke der letzten Monate:

CSVW alias CSV on the Web ist ein auch vom britischen GDS offiziell empfohlener W3C-Standard, um klassische tabellarisch vorliegende Datenbestaende mit Semantik anzureichern. Das oben eingebettete Webinar gibt einen kleinen Ueberblick, diese Website mit „maturity levels“ erklaert schoen bildlich Schritt fuer Schritt, wie man von einer (fuer menschlichen Konsum gedachten) Tabelle bis zu tatsaechlichem Linked Data kommen kann.

Das Beispiel mit den maturity levels gefaellt mir deswegen so gut, weil es einen haeufig genannten Knoten loest. Bei der klassischen Darstellung der Treppe von 1*- bis 5*-Daten stolpern viele ueber die Frage, wie man denn von CSV weiter in Richtung Linked Data kommen kann. Das Beispiel beginnt bereits damit, nicht nur ein CSV, sondern ein „tidy“ CSV herzustellen. Schon das ist ein enorm wichtiger Schritt, der aber bei staatlichen Datenbestaenden viel zu oft ausgelassen wird – vermutlich auch deswegen, weil diejenigen, die diese Datenbestaende anlegen, sie nur sehr selten ueberhaupt selber automatisiert weiterverarbeiten. (Danke an Benjamin Degenhart fuer den Tipp)

Von einem weiteren spannenden Projekt erzaehlte mir Matthias Groenewald auf dem Open-Data-Barcamp in Hamburg: Lokale Besluiten Linked Open Data (LBLOD) ist eine fuer Flandern entwickelte Werkzeugkiste, mit der Protokolle semantisch annotiert werden koennen.

Das Projekt ist bereits ueber 10 Jahre alt und mir bislang peinlicherweise noch nie ueber den Weg gelaufen – die zugehoerigen Github-Repositories legen aber die Vermutung nahe, dass das bis heute aktiv eingesetzt wird. Hier ist beispielhaft ein so aufbereitetes Ratsprotokoll von Ende Maerz aus Mesen.

Das finde ich auch deswegen so spannend, weil gerade „Agentic AI“ als Allheilmittel fuer alle moeglichen Verwaltungsdigitalisierungsprobleme in den Ring geworfen wird – auch z.B. fuer angeblich so komplizierte haendische Schwaerzungen bei der Erfuellung von Antraegen nach Informationsfreiheitsgesetzen. Haette man – wie Flandern – schon vor 10 Jahren damit angefangen, Dokumente semantisch zu annotieren, haette man damit z.B. auch „hier ist ein Personenbezug“ maschinenlesbar einfuegen koennen. Mit nur ein klein wenig mehr Weitsicht beim Anlegen der Dokumente wird damit eine automatisierte Schwaerzung zum Kinderspiel – ganz ohne irgendwelche „Agentensysteme“.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert