Was ist denn dieses “Crowdsourcing” ueberhaupt?

Einige Leser duerften sich jetzt ausklinken, aber ich muss dieses Blog mal wieder dafuer nutzen, wofuer ich es urspruenglich angeschafft habe: Als Gedankenmuellhalde, auf der ich meine Ueberlegungen ablegen und dabei strukturieren kann

Eine meiner Seminararbeiten dieses Semesters wird sich naemlich um Crowdsourcing drehen, und obwohl ich das Thema urspruenglich gar nicht haben wollte, finde ich es immer faszinierender. Und da ich jetzt mit der Literaturrecherche anfange und mich durch tausend Papers wuehlen werde, moechte ich erst einmal das festhalten, was ich mir bisher ausgedacht habe.

Erst einmal ist der Begriff relativ diffus — im Wesentlichen geht es einfach nur darum, dass eine bestimmte Arbeit an viele Leute verteilt wird. Entweder macht man das, weil man selber keine Lust darauf oder Ressourcen dafuer hat (Firmen wollen damit auch gerne Geld sparen). Oder aber man vertraut dabei auf die Intelligenz der Masse, weil heterogene Ansammlungen ganz verschiedener Leute, anders als man vielleicht zunaechst meinen wuerde, bei der Erledigung mancher Aufgaben deutlich besser sind als einzelne Experten. Letzteres ist gar nichts so neues, Francis Galton nannte es schon 1906 Vox Populi: Als damals 787 Leute das Lebendgewicht eines Ochsen (1198 Pfund) schaetzen sollten, lagen die einzelnen Schaetzungen zwar zum Teil weit vom tatsaechlichen Ergebnis entfernt, den Mittelwert aller Schaetzungen errechnete Galton aber bei 1207 Pfund, also mit nur 0,8% Abweichung vom tatsaechlichen Ergebnis. Klingt also prinzipiell prima: Der Schwarm ist intelligenter oder zumindest staerker als die einzelnen Mitglieder des Schwarms, also schreiben wir alle Probleme oeffentlich aus, und der Superorganismus Internet wird’s schon richten.

Klappt aber nicht. Jedenfalls nicht immer.

Im Fontblog gibt es heute eine beispielhafte Aufzaehlung von Crowdsourcing-Aktionen, die in die Hose gegangen sind, natuerlich aus dem Designbereich. Der Logowettbewerb von Frank-Walter Steinmeier ist nur ein Beispiel. Andere Wettbewerbe — dem Gefuehl nach hauptsaechlich die Aktionen, die von irgendwelchen Werbeagenturen konzipiert werden — locken keinen Hund hinter dem Ofen hervor. Woran koennte das liegen?

Die erste Idee war, die Crowdsourcing-Konzepte, die ich kannte, ein wenig zu ordnen. Man kommt auf diese Weise relativ schnell auf die folgenden Kategorien:

Grosser Sandhaufen, viele Schaufeln: Man hat einen grossen Haufen simpler Arbeit, die von Maschinen nicht, von Menschen aber relativ einfach erledigt werden kann. Auf diese Weise funktionieren recaptcha oder das Projekt des Guardian, zwei Millionen(!) Seiten Dokumente von 20.000 Freiwilligen durchsuchen zu lassen, um so eine Schmiergeldaffaere aufarbeiten zu koennen. Die einzelnen Arbeitsbloecke lassen sich mehr oder weniger beliebig gross einteilen, bauen nicht oder nur kaum aufeinander auf, koennen parallel abgearbeitet werden und lassen sich hinterher problemlos wieder zusammenfuehren. Distributed-Computing-Systeme wie SETI und Co. wuerde ich auch gefuehlsmaessig hier einordnen, auch wenn hier tatsaechlich die Maschinen arbeiten, nicht die Menschen.
Irgendwo wird sich schon ein Experte finden: Wir haben ein Problem, fuer das es viele moegliche Loesungen gibt, letzlich kann aber nur eine einzige eingereichte Loesung verwendet werden. Kollaboration ist quasi nicht moeglich, und oft bedarf es ausreichender Kenntnisse, um eine hochwertige Loesung zu finden. Typische Vertreter dieser Gattung sind Logowettbewerbe oder Logo-crowdsourcing-Plattformen.
Evolutionaere Projekte: Man beginnt mit einem relativ einfachen Grundstock, der sukzessive kollaborativ erweitert wird, bis man einem Ziel moeglichst nahe kommt. In den unterschiedlichen Entwicklungsstadien (die bisweilen innerhalb eines Projektes auch gleichzeitig vorkommen) koennen Personen verschiedener Kenntnisstaende ihre Beitraege leisten und fuer die Weiterentwicklung des Systems sorgen. Beispiele sind die Wikipedia und Open-Source-Projekte.

Die Grenzen sind bisweilen fliessend.

Zweitens faellt auf, dass es quasi immer eines Anreizes bedarf, Zeit und Hirnschmalz fuer diese Arbeit zu investieren. Bei der Schmiergeldaffaere ist es tatsaechlich “oeffentliches Interesse”, wegen dessen sich ein Teil der interessierten Oeffentlichkeit durch die Akten wuehlt, bei den Logowettbewerben ein ausgelobtes Preisgeld oder die schiere Begeisterung fuer die Sache (Obama! Piraten! Jehova!), und bei vielen Open-Source-Projekten einfach die pure Notwendigkeit, dem WLAN-Router jetzt auch noch Asterisk, VLANs und ENUM-Lookup beizubringen (und, natuerlich, Muhgeraeusche zu machen. Das ist meistens wichtiger als alles andere).

Die fehlgeschlagenen Kategorie-2-Crowdsourcingprojekte scheinen also hauptsaechlich daran zu scheitern, dass die wirklich guten Experten keinen Anreiz hatten, sich an den Wettbewerben zu beteiligen — ich bin mir aber ohnehin uneins, ob man hier den Begriff “Crowdsourcing” ueberhaupt verwenden sollte. Sollte “Crowd” schon deswegen gelten, weil man den Auftrag an eine grosse Menge von Leuten ausschreibt, oder sollte das erst zutreffen, wenn auch tatsaechlich eine gewisse Menge von Menschen am Endprodukt mitarbeitet?

Einmal davon abgesehen, ist eine weitere Frage, wie man einen geeigneten Anreiz fuer die Arbeit an Crowdsourcingprojekten findet. Recaptcha kombiniert das klassische Captcha — das auszufuellen notwendig ist — mit der Eingabe ocr-unlesbarer Texte, also quasi die Kombination des Notwendigen mit dem Nuetzlichen. Nachdem es fuer einige Menschen offenbar auch die vollkommene Erfuellung darstellt, taeglich stundenlang ihre Farmen auf Facebook zu pflegen, koennte man auch darueber nachdenken, verteilte Arbeiten in Spielen loesen zu lassen. Es scheint also so, als muesste ich auch mal bei den Psychologen anklopfen

…ja, das sind die Fragen, mit denen ich mich jetzt so beschaeftigen werden. Und einmal aufgeschrieben wirken sie gar nicht mehr so maechtig und bedeutend wie im Kopf. Aber zumindest habe ich jetzt einmal einen Anfang — und kann nun herausfinden, wie viel des oben geschriebenen schon vor Jahren in wissenschaftlichen Journals klassifiziert und beschrieben wurde

Edit: Fleissaufgabe — in welche Kategorie faellt die Blogosphere?

stk

schlampig sortiertes Zeug, das ich schon immer mal sagen wollte.

Was ist denn dieses “Crowdsourcing” ueberhaupt?

Schreibe einen Kommentar Antworten abbrechen