datenjournalismus workshop am fjum
DESCRIPTION
Am 18.11.2011 habe ich gemeinsam mit Zeit Online Entwicklungsredakteur Sascha Venohr ein Übersichtsseminar zum Thema Datenjournalismus mit praktischen Übungen gegeben. (Veranstalter: fjum Wien und Schweizer MAZ). Dies sind die Folien dazu.TRANSCRIPT
Mit Daten Geschichten erzählen
Wien 18.10.2011
Ulrike Langer (medialdigital.de) und Sascha Venohr (Zeit Online)
Worum geht es?
YouTube-Link zum Zapp-Beitrag (5 min.) Langfassungen der Interviews
Die Pioniere
Der Prototyp des Datenjournalismus: Everyblock
eine vielseitig recherchierbare, immer neu gefütterte Datenbank
Projekt des Progammierer-Journalisten Adrian Holovaty,hervorgegangen aus der Seite chicagocrime.org
alt
neu
mit Community-Funktionen
The Guardian
Investigate your MP‘s Expenses
Frühjahr 2009
Der Guardian bereitete im Frühjahr 2009 die gesamten verfügbaren Daten zum Spesenskandal der britischen Unterhaus-Abgeordneten (Wer hat welche Steuernachlässe in Anspruch genommen? Wer hat sie zurückgezahlt? Wer nicht?)
- interaktive Darstellungsform
- kollaborativer Charakter des Projekts (Crowdsourcing)
- ständige Fortschrittsberichte
-Abschlusspräsentation
„Can you do something with this data? Please post us your visualisations and mash-ups below or mail us at
MP‘s expenses: All the revelations as a spreadsheet (Guardian)
Seitdem beim Guardian:
data blogdata store
world government data search
Beispiel für eine Anwendung, die auf Daten aus dem data store beruht:
London traffic cam viewer for the iPad
aktuell: Wettbewerb von Guardian und David McCandless (Information is Beautiful)
BBC: The World at 7 Billion
New York Times
Rent or BuyCalculator
Es muss nicht immer eine
Visualisierung sein.
Die NYT veranschaulicht die minimalen Ergebnis-
unterschiede im Spitzensport
mit akustischen Effekten
Olympic Musical
“Data Porn” - überfrachtete, unverständliche Grafik
Quelle:Washington Post
Der Westen: Verbindung von Datenjournalismus und Crowdsourcing über ein anonymes Informantenportal (Upload-Portal)
Der Fall Envio - datenjournalistisch aufbereitet
taz Fluglärmkarte
nahraum.de
ein regionales + lokales flickr
Start: 11.11.2009
Stand nach 6 Monaten: 1.700 Nutzerkonten, rund 50.000 hochgeladene Bilderin 4/10: 2,7 Mio PIs. Tendenz steigend
Dienstleister: wissenmedia (Bertelsmann)
- „das lokale Foto-Gedächtnis einer Region“
Projekt der „Ruhrnachrichten, Medienhaus Lensing,Ost-Ruhrgebiet, West-Münsterland
Zugänge zum Fotoportal über Startseite, lokale Suche, Verschlagwortung von möglichst vielen Texten der Lokalausgaben
Wenn Medien Datenschätze nicht heben, dann tun es eben andere
Der transparente Bundeshaushalt - lässt sich auf kommunale Haushalte übertragen
http://bund.offenerhaushalt.de/ von Tactical Tools
• Jeder Klick auf einen Haushaltsposten bringt eine weitere Aufschlüsselung der Gelder.
• 1200 Seiten Papierinformationen mit rund 7000 Posten, die sich in weitere anklickbare Unterposten gliedern.
• Die Zahlen werden zu jedem Posten auch auf einer Zeitleiste von 2003 bis 2011 dargestellt – einige Zahlen erst ab 2005.
• Jeder Haushaltsposten hat eine eigene Internetadresse und kann mit Artikeln oder einer Online-Diskussion verlinkt werden.
• weitere Haushalte für Länder und und Kommunen unter Subdomains sollen folgen.
mehr dazu bei: kooptech
OWNI.fr
OWNI - Où je vote?
- Projekt zu den französischen Regionalwahlen im Frühjahr 2010- Applikation, die Nutzern zeigt, in welchem Wahllokal sie am Wahltag wählen können.- erstes Crowdsourcing-Experiment von OWNI: Nutzer tippten eingescannte Dokumente ab, damit sie computerlesbar wurden- zum Wahltag war die Facebook App fertig, funktionierte aber mangels genügend valider Daten nicht perfekt
Frankfurt Gestalten
Basis Open Street Map
lokalisiert lokalpolitische Entscheidungen, Anträge, Bürgerbegehren etc. auf
einer Karte
deckt alle 42 Stadtteile von Frankfurt ab
sechsköpfiges Designer- und Entwicklerteam
Projekt der Open Knowledge
Foundation
Christian Kreutz (Politologe, Initiator): "Inspiriert von Projekten in anderen Ländern kam mir die Idee eines Tages als ich im Ortsbeirat saß. Wie wäre es wenn sich Bürger direkt über das Internet vernetzen und Ideen zur Stadtgestaltung austauschen."
Frankfurt gestalten: Nutzer können eigene Initiativen starten
Bürger kreieren über eine offene Schnittstelle
Anwendungen aus den Datensätzen und stellen sie der
Allgemeinheit zur Verfügung
ortsbasierte Informationen über soziale Netzwerke anbieten (Twitter, Facebook, Foursquare etc.)
Foursquare-Nutzer können Restaurant- und Freizeittipps der „National Post“ (Toronto) in
ihre To-Do-Liste übernehmen
Hands-On-Crashkurs von Sascha Venohr:
Datenvisualisierung mit Google Fusion Tables
Visualisierung der internationalen Waffenausgaben
(im Verhältnis zum jeweiligen Bruttosozialprodukt)
• Werkzeuge:
• Google Spreadsheet (Datenaufbereitung alternativ auch mit anderen Tabellenkalkulationen, z.B. MS Excel)
• Google Fusion Table
• Datensatz:
• SIPRI Military Expenditure Database
(kompletter Datensatz im Excel-Format zu Semi- n narzwecken bereits als öffentliches Google-Doc)
Schrittweises Vorgehen:
1. Über diesen Link wird der Komplett-Datensatz als Google-Spreadsheet geöffnet.
2. Da dieses Dokument schreibgeschützt ist, erstellen wir eine Arbeitskopie. (Menüpunkt Datei > Kopie erstellen)
3. Wir wählen das Tabellenblatt „Share of GDB“ aus. In diesem Datensatz wird dargestellt, wieviel Prozent des jährlichen Bruttosozialprodukts auf den Wehretat entfallen sind. Diese Prozentwerte ermöglichen eine Vergleichbarkeit der Länder im Hinblick auf die Intensität der Rüstungsbestrebungen.
4. Damit wir mit Säubern der Daten beginnen können, müssen wir zunächst die Fixierung der Kopfzeilen entfernen. Hierzu greifen wir ganz links auf Höhe der Tabellenüberschriften das kleine blaue Element und ziehen es ganz nach oben aus dem Dokument heraus [s. Abb.].
5. Nun können die Zeilen 1-5, die nur textliche Informationen über den Datensatz enthalten, gelöscht werden (Zeilen markieren und über Menüpunkt Bearbeit „Zeilen1-5 löschen“).
6. Gleiches wird nun zeilenweise bei Zwischenüberschriften oder dort angewendet, wo in den Ländern keine Daten vorhanden sind (bspw. German DR).
7. Da wir aus Aktualitätsgründen auf die Werte ab Jahr 2000 aufwärts beschränken wollen, werden nun die Spalten mit den älteren Jahreszahlen gelöscht. Dazu werden diese ebenfalls markiert und über den Menüpunkt Bearbeiten > „Spalten F-M löschen“ entfernt.
8. Da Waffenausgaben ihre Wirkung über einen längeren Zeitraum entfalten, wollen wir nun für die zu betrachtenden Jahre einen Durchschnittswert berechnen. Hierzu benötigen wir ganz rechts eine zusätzliche Spalte. Hierzu gehen wir in Spalte 2009 gehen über das Menü über Einfügen > Spalte rechts. Diese neue Spalte nennen wir „Formel-Durchschnitt“.
9. Wir gehen in die Zeile des ersten Landes und fügen in die neue Spalte unsere Formel ein, mit der wir aus den Jahren 2000 bis 2009 den durch-schnittlichen Anteil am Bruttosozial-produkt der Wehrausgaben berechnen wollen. Hier bedienen wir uns der Funktion „Average“. Und wählen den Zellraum aus, in unserem Fall die Zellen B1:K7. Unsere konkrete Formel =AVERAGE(B2:K2) [s. Abb.]. Wir fassen die Zelle mit der Formel mit gedrückter Maustaste im rechten Eck und ziehen diese komplett in der Spalte nach unten. Dadurch wird die Formel für alle weiteren Zeilen automatisch transponiert.
10. Um die damit berechneten Durchschnittswerte von der Formel zu entkoppeln, fügen wir eine zusätzliche Spalte ganz rechts ein (Menü Einfügen > Spalte rechts).
11. Nachdem wir die komplette Spalte „Formel Durchschnitt“ markiert und in die Zwischenablage kopiert haben, springen wir in die neue rechte Spalte in die erste Zelle und gehen über Menü Bearbeiten > Inhalte einfügen > Nur Werte einfügen. Die neue Spalte nennen wir der Einfachheit halber „Durchschnitt“.
12. Nun können wir abschließend die Jahresspalten und die nur zur Berechnung notwendige Spalte „Formel Durchschnitt“ löschen (Spalten markieren und über Bearbeiten > Spalten B-L löschen).
13. Wir haben nun eine aufgeräumte und einfache Datengrundlage, mit einer Spalte für den Ländernamen und einer Spalte mit dem durchschnittlichen prozen-tualen Anteil am Bruttosozial-produkt, den diese in den Jahren 2000-2009 aufgewendet haben. Diese Daten expor-tieren wir zunächst als CSV-Datei. Hierzu gehen wir auf Datei > Herunterladen als > CSV (aktuelles Tabellenblatt) und speichern die Datei lokal. [s. Abb.]
14. Nun wollen wir unseren verschlankten Datensatz auf einer Weltkarte visualisieren. Hierzu wollen wir das kostenlose Tool Google Fusion Tables verwenden. Wir springen in die Übersicht „Text & Tabellen“ bei GoogleDocs. Im Menü „Erstellen“ wählen wir den Eintrag „Tabellen (Beta)“ aus. Im ersten Dialogpunkt besteht die Möglichkeit, unsere lokal gespeicherte CSV-Datei über „Durchsuchen“ auszuwählen. Vor dem Hochladen akzeptieren wir die vorgeschlagenen Einstellungen auf „Comma“ und „UTF-8“. Durch zweimaliges Klicken auf „Next“ importieren wir diese neue Tabelle in Fusion Tables. Bevor der Vorgang abgeschlossen wird, können wir der Tabelle einen neuen aussagekräftigen Titel im oberen Feld vergeben.
15. Fusion Tables bietet nun eine einfache Möglichkeit, auf Basis von Ländernamen eine Geocodierung vorzu-nehmen. Diese Funktion finden wir unter File > Geocode. [s. Abb.] Im folgen-den Dialog bestätigen wir das vorausgewählte Feld „Country“ und stoßen dasautomatische Matching an. Nach dem 100% erreicht sind, schließen wir den Dialog durch Klicken auf das X rechts oben.
16. Nun sind wir kurz vorm Ziel. Über das Menü Visualize > Intensity Map überträgt Fusion Tables die Werte auf eine Weltkarte und färbt die Länder in Abstufungen automatisch ein. Voilà:
Überblick Werkzeuge:
scrapen veredeln visualisieren
Google Spreadsheets
Grundlagentool. Cloudbasiertes Pendant zu Microsofts Tabellenkalkulationsprogramm Excel. Links zu drei Tutorials (engl.).
Google Fusion Tables
Grafiken, Diagramme und Karten erstellen. Schritt-für-Schritt-Anleitung von Lorenz Matzat anhand des Beispiels "Postfilialen in Berlin auf Karte eintragen" aus der taz-Webseite.
Google Refine
Eine freie Software, die Datensätze in Tabellen säubert,
OpenCalais
OpenCalais (Thomson Reuters) erkennt semantische Textbausteine und reichert sie mit Metadaten an. So lassen sich in riesigen blitzschnell zum Beispiel, Namen, Orts- oder Datumsangeben, Telefonnummer, Email-Adressen oder auch auffällige Worthäufungen heraussuchen und abgleichen. Funktioniert derzeit nur auf engl.
Document Cloud
Ein Werkzeug zum gemeinsamen Bearbeiten, Analysieren, Verfeinern und Veröffentlichen von Datensätzen in der Datenwolke (nur engl.).
Many Eyes
Ein von IBM Research entwickeltes freies Tool zum Visualisieren von Daten in interaktiven Grafiken oder Kartensätzen. Schritt-für-Schritt-Anleitung von Datenjournalist Lorenz Matzat.
Open Tableau
Datenvisualisierungs-Software
Yahoo Pipes
Mit Yahoo Pipes kann man Blogs, Twitterfeeds, etc. filtern und automatisiert einlaufen lassen. Tutorial von Lorenz Matzat
Scraper Wiki
Scraper Wiki vernetzt Programmierer mit Auftraggebern.
Wordle
Einfach zu nutzendes Werkzeug zum Visualisieren von Worthäufigkeiten in Texten. Selbst erstellte Wordles dürfen auch kommerziell genutzt werden.
Weitere Werkzeuge: 10 tools that can help data journalists do better work, be more efficient (Poynter)
Weiterbildung, Initiativen und Ressourcen
Codeacademy Schritt-für-Schritt-Anleitungen (engl.) um JavaScript Basics zu lernen.
Data Driven Journalism Übersichtsportal des European Journalism Centre (EJC) mit einer Fülle von Ressourcen, weiterführenden Beiträgen und Beispielen.
Design Meets Data lose Gruppe von Journalisten, Programmierern, Webdesignern, etc., die sich alle 14 Tage in Berlin trifft.
Datenjournalismus Berlin Berliner Gruppe, die ca. alle 6 Wochen Treffen zum Thema Datenjournalismus mit wechselnden Schwerpunktthemen organisieren.
Hacks/Hackers Hacks/Hackers (Journalisten und Programmierer) treffen sich regelmäßig in 20 US-Städten, u.a. auch in London und Brüssel). "Survival" Glossar (engl.) zu datenjourn. Begriffen.
Open Data Network Netzwerk, das die Themen Open Government, Open Data, Transparenz und Partizipation auf die politische Agenda bringen will. Das Netzwerk veranstaltet Workshops und Barcamps und vermittelt Spezialisten für datenspezifische Projekte zu vermitteln. Open Government Data Austria Private Initiative, die mit Verwaltungen und Organisationen kooperiert.
Open Data Initiative Schweiz Unabhängige Initiative für offene DatenOpen Knowledge Foundation Bildungsveranstaltungen und Projekte zum Thema offenes Wissen, Veröffentlichungen http://okfn.org / http://okfn.de
forum journalismus und medien - neues Journalisten-Weiterbildungszentrum in Wien mit u.a. Schwerpunkt Datenjournalismus
Link
kollaborativesProjekt, das im Nov. 2011 auf dem Mozilla Festival in
London gestartet wurde.
Das Buch entsteht auf der Google Docs
Platform unter einer cc-Lizenz.
Vielen Dank!
Vernetzung?
medialdigital Facebook-Seite@mauisurfer25 (Twitter)
Google+ Profil