OpenData und Co
Introduction to Data Science mag ich heute besonders hervorheben, weil es ein komplettes Buch rund um Datenauswertung mit R ist, und weil es frei ist (cc-by-nc-sa).
Es beginnt mit einer kleinen Einfuehrung, was ueberhaupt Daten sind, und warum der Autor das kommandozeilenorientierte R statt Excel und Co verwendet (einen Aufsatz ueber die Verbreitung und damit einhergehende Gefaehrlichkeit von Excel gibt es hier, via @343max/@hulalena), fuehrt in kleinen Schritten ueber Data Frames auf statistische Grundlagen wie Quantile, Histogramme und Signifikanz hin, bevor es mit R Studio dann doch klickibunti benutzerfreundlicher wird, um Twitter und Texte zu analysieren, Daten zu speichern und (mein Lieblingsthema! :D) Karten zu bauen.
Alle Beispiele sind aus der Praxis gezogen und ersetzen zwar mit Sicherheit keine tiefere Beschaeftigung mit statistischen Methoden, eignen sich aber wunderbar als Einfuehrung und Appetitmacher auf mehr. Leseempfehlung!
Ausserdem:
- Diverging Color Maps for Scientific Visualization — wie man Diagramme „richtig“ einfaerbt. R-BenutzerInnen kennen und lieben natuerlich RColorBrewer hierfuer 🙂 (via @d33r)
- Getting Started with Open Data — A Guide for Transportation Agencies [PDF] — kleiner englischsprachiger Primer fuer Nahverkehrsanbieter, warum und wie man Fahrplandaten oeffnet.
- Made to Measure: Reshaping Horsemeat Import/Export Data to Fit a Sankey Diagram — nettes Ding, das ueber die Data-Driven-Journalism-Liste hereinkam: Eine Anleitung, wie man die Wege von Pferdefleisch in der EU in ein Sankey-Mengenflussdiagramm abbildet. Mit Code zum selbst ausprobieren! \o/
- Technische Empfehlungen fuer OpenData — Google-Doc von Marian Steinbach als Empfehlung an die Stadt Koeln, wie man CSV-Dateien formatieren moechte.
API
- Drucksachen und Plenarprotokolle des Deutschen Bundestags (via)
- public-transport-enabler — Öffi-API fuer Java
- ZEIT-Developer-API (via)
Unterhaltung
- Stenocast, Folge 0/1 / stenocast.de — Herr Urbach und Co. lesen alte Plenarprotokolle der Bonner Republik. Arbeitstitel: „Too old, didn’t read“.
- The Importance of Excel — ob das so unterhaltend ist, sei mal dahingestellt: Warum Excel so weit verbreitet ist, ueberall benutzt wird — und welche Konsequenzen das hat (nochmal aufgegriffen von oben)
- The Robbers Cave Experiment — Wie Sozialpsychologen einfach mal zwei sommercampende Kindergruppen aufeinander treffen liessen um herauszufinden, was man braucht, damit die sich bekriegen. Aufloesung: Gar nix weiter. (via erlehmann und plom)
- Traumatische Momente im Kinderfilm — die 50 verstoerendsten Kinderfilmszenen, von den Geisterelefanten bei Dumbo bis — natuerlich — zu Bambis Mutter. (via/@leitmedium)