Loading…
Venue: U1 clear filter
arrow_back View All Dates
Friday, June 13
 

10:45 CEST

DDJ-Toolbox: Scraping mit Python Limitierte Plätze
Friday June 13, 2025 10:45 - 13:00 CEST
„Scraping“, also das systematische, automatisierte Speichern von Web-Inhalten ist gleichzeitig eine der häufigsten Aufgaben für Datenjournalist*innen – aber auch eine, bei der man viele Fehler machen kann. Deshalb zeigen wir Schritt für Schritt, wie wir die Daten sammeln, speichern und zur Analyse vorbereiten.

Wir zeigen, wie man die Funktionsweise der Website im Browser nachvollziehen kann und geben Tipps für den Umgang mit typischen Hürden. Wir zeigen, wie man robuste Skripte entwickelt und gehen dabei auf die einzelnen Schritte von Scraping bis Parsing ein und wie sie ineinander greifen. Außerdem stellen wir hilfreiche Bibliotheken und Tools vor und sprechen über ethische Fragestellungen.

Der Workshop richtet sich vor allem an Scraping-Einsteiger*innen mit Grundkenntnissen in Python und/oder R, aber auch "alte Hasen" können ihre eigene Methodik aufpolieren.

Der Workshop umfasst zwei Stunden und gliedert sich in zwei Teile: In der ersten Stunde stellen wir hilfreiche Konzepte und Herangehensweisen vor – in der zweiten Stunde probieren wir die dann gemeinsam praktisch aus. Dafür ist ein Rechner mit installiertem Python nötig.

Achtung: Aufgrund der limitierten Plätze ist eine Voranmeldung via Sched nötig! Bitte tragt Euch nur ein, wenn Ihr wirklich vorhabt, zu kommen. Sollten vor Ort noch Plätze frei sein, wird per Warteliste vergeben.
Speakers
avatar for Julia Barthel

Julia Barthel

Datenjournalistin, BR Data
Julia Barthel arbeitet als Daten- und Investigativjournalistin für den Bayerischen Rundfunk bei BR Recherche / BR Data. Volontiert hat sie beim NDR, nach einem Studium in Jena und Osnabrück – mit viel praktischer Radioerfahrung und ehrenamtlichem Jonglieren mit (offenen) Date... Read More →
avatar for Claus Hesseling

Claus Hesseling

KI und Daten, NDR / Trainer
Claus Hesseling ist freier Datenjournalist und Trainer. Er ist derzeit "KI Lotse" beim NDR und bringt Menschen Recherche, Daten, Coding und KI bei.
SJ

Stephanie Jauss

SWR Data Lab
Stephanie Jauss ist seit August 2024 Datenjournalistin im SWR Data Lab. Zuvor hat sie Computer Science and Media sowie Investigativjournalismus studiert und in den Bereichen Webentwicklung und Künstliche Intelligenz gearbeitet.
Friday June 13, 2025 10:45 - 13:00 CEST
U1 Haus 3, Hugh-Greene-Weg 1, Hamburg-Eimsbüttel, Deutschland

14:00 CEST

Stalking ourselves – Personensuche mal andersrum Limitierte Plätze
Friday June 13, 2025 14:00 - 15:00 CEST
Online-Recherche-Tools können sehr weit in die Privatsphäre der Zielpersonen eindringen, dafür bräuchte es ein entsprechend großes öffentliches Interesse. Zum Ausprobieren der Tools machen wir daher in diesem Workshop Partner-Recherchen, bei denen sich je zwei Seminarteilnehmer gegenseitig mit den wichtigsten Tools durchchecken. Am Ende hat jeder eine recht gute (wenn auch immer unvollständige) Auswertung, was Dritte über sie/ihn im Netz finden können. Der erste Schritt, seine eigenen Daten ggf. besser zu schützen.

Im Workshop zeigen wir die Grundlagen der Personensuche - von Googlen, über nickname-Suche, data breaches, Biometrie bis hin zu Spezialtools. Den Teilnehmenden, die sehr viel zu Personen recherchieren wird empfohlen, bei osint.industties um einen kostenlosen Account zu bitten. Registrierten Teilnehmenden steht ein Probezugang für elephantastics zur Verfügung, ggf. auch für weitere Tools. Daneben können die Accounts der Dozenten für Recherchen verwendet werden, wenn z.B. die Tricks der Dozenten nicht reichen, etwa die Quellen der von pimeyes gefundenen Bilder zu identifizeren. Punktuell schauen wir auch, welche Passwörter zu einzelnen Personen im Netz zu finden sind.
In einem Ausblick zeigen die Dozenten: Wo KI erstaunliches zu Personen finden kann oder auch mal krass irrt.
Speakers
avatar for Marcus Lindemann

Marcus Lindemann

geschäftsführender Autor, autoren(werk) GmbH & Co.KG
Marcus Lindemann ist Dozent für Recherche, TV-Journalismus und Presserecht sowie geschäftsführender Autor der TV-Produktionsfirma autoren(werk). Seit 25 Jahren produziert er Magazinbeiträge und Dokumentationen für öffentlich-rechtliche Sender, insbesondere zu Wirtschafts- und... Read More →
OK

Oliver Klein

Faktencheck, ZDFheute
Wie beim letzten Mal
Friday June 13, 2025 14:00 - 15:00 CEST
U1 Haus 3, Hugh-Greene-Weg 1, Hamburg-Eimsbüttel, Deutschland

15:30 CEST

DDJ-Toolbox: Datenbanken aufsetzen und abfragen
Friday June 13, 2025 15:30 - 17:45 CEST
Wenn CSV-Dateien nicht mehr ausreichen oder Excel ohnehin schon in die Knie gegangen ist – dann braucht es eine Datenbank. Deshalb zeigen wir Schritt für Schritt, wie Datenbanken genau funktionieren, wann man sie sinnvollerweise nutzt, wie man sie anlegt und abfragt.

Wir erklären die grundlegenden Funktionsweisen von Datenbanken und Abfragesprachen und gehen dabei näher auf die praktische Arbeit mit SQLite, DuckDB und PostgreSQL ein, auch im Zusammenspiel mit den Programmiersprachen Python, R oder der Kommandozeile. Außerdem zeigen wir, wie eine Datenbank aufgebaut wird, welche Tools es grundsätzlich gibt und wie generative Sprachmodelle insbesondere bei der Übersetzung von Abfragen von menschenverständliche Sprache in Maschinensprache unterstützen können.

Der Workshop richtet sich vor allem an Datenbank-Einsteiger*innen. Grundkenntnisse in Python und/oder R sind hilfreich, aber keine zwingende Voraussetzung.

Der Workshop umfasst zwei Stunden und gliedert sich in zwei Teile: In der ersten Stunde stellen wir hilfreiche Konzepte und Herangehensweisen vor – in der zweiten Stunde probieren wir die dann gemeinsam praktisch aus.

Wichtig: Dafür ist ein Rechner mit installiertem DBeaver nötig. Außerdem: Ladet Euch die Beispieldaten aus der ARD/ZDF-Box herunter: https://share.ard-zdf-box.de/s/ZPtpyZcjbiLMQGi

Achtung: Aufgrund der limitierten Plätze ist eine Voranmeldung via Sched nötig! Bitte tragt Euch nur ein, wenn Ihr wirklich vorhabt, zu kommen. Sollten vor Ort noch Plätze frei sein, wird per Warteliste vergeben.
Speakers
avatar for Claus Hesseling

Claus Hesseling

KI und Daten, NDR / Trainer
Claus Hesseling ist freier Datenjournalist und Trainer. Er ist derzeit "KI Lotse" beim NDR und bringt Menschen Recherche, Daten, Coding und KI bei.
avatar for Julia Barthel

Julia Barthel

Datenjournalistin, BR Data
Julia Barthel arbeitet als Daten- und Investigativjournalistin für den Bayerischen Rundfunk bei BR Recherche / BR Data. Volontiert hat sie beim NDR, nach einem Studium in Jena und Osnabrück – mit viel praktischer Radioerfahrung und ehrenamtlichem Jonglieren mit (offenen) Date... Read More →
SJ

Stephanie Jauss

SWR Data Lab
Stephanie Jauss ist seit August 2024 Datenjournalistin im SWR Data Lab. Zuvor hat sie Computer Science and Media sowie Investigativjournalismus studiert und in den Bereichen Webentwicklung und Künstliche Intelligenz gearbeitet.
Friday June 13, 2025 15:30 - 17:45 CEST
U1 Haus 3, Hugh-Greene-Weg 1, Hamburg-Eimsbüttel, Deutschland
 
Share Modal

Share this link via

Or copy link

Filter sessions
Apply filters to sessions.
Filtered by Date -