Für das Projekt Serienpolitik der Popästhetik: Superhero Comics und Science-Fiction-Heftromane wurden mehrere Datensätze rund um Perry Rhodan und Captain America gesammelt. Ein Datensatz wird hier vorgestellt und erläutert wie er von anderen Forscher:innen nachgenutzt werden kann.

Vom Forum zum Datensatz

Am 1.8.2022 wurden die Seiten im Perry Rhodan-Forum (forum.perry-rhodan.net) mithilfe von wget rekursiv gesammelt. Diese Ausgangsdaten wurden unter anderem mit der der Python Bibliothek Beautiful Soup in die Bestandteile des Forums zerlegt (Unterforen, Threads, Beiträge) und in einer PostgreSQL-Datenbank gespeichert. Diese Datenbank steht den Forscher:innen des Teilprojekts über Metabase als Oberfläche zur Verfügung.

Entity Relationship Diagram der erstellten Datenbank

Nachnutzung

Sie sind Wissenschaftler:in an einer anerkannten Forschungseinrichtung und möchten mit den Daten arbeiten? Kontaktieren Sie uns unter luca.hammer@uni-siegen.de

Option 1: Wir geben ihnen Zugriff auf unsere Metabase-Instanz. Mit dieser könnnen Sie die Daten durchsuchen, Berechnungen durchführen und Teile der Daten exportieren.
Option 2: Sie erhalten den vollständigen Datensatz als SQL-Export.

Arbeit mit den Daten

Zusätzlich zu der Ansicht auf die Daten via Metabase werden verschiedene visuelle Perspektiven entwickeln.

Zentrale Fragen beim Betrachten der Datenbankansicht sind beispielsweise:
Was finden wir daran interessant?
Wie finden wir jetzt die Threads, in denen was los ist?
Wie übersetzen wir „hier ist etwas los“ in Datenabfragen?

Zwischen den Daten in der Datenbank und den Visualisierungen liegen einige Übersetzungsschritte. Auf diesem Weg entstehen weitere Datenpunkte als Stützpfeiler für neue Thesen. Dabei kommt kein eigenständiges Tool zum Einsatz: Die Übersetzung geschieht mithilfe der Programmiersprache R.

Ein solcher Datenpunkt für weitere Analysen ist das Maß der Antwortdynamik. Wie schnell antworten Personen innerhalb eines Threads, wie schnell folgt eine Antwort auf die Nächste? Und welche durchschnittliche Dynamik ergibt sich für diesen Thread dadurch? Dadurch werden die Threads untereinander vergleichbar.

Das Ergebnis ist eine weitere Tabelle, die sich nach diesem Wert sortieren lässt. Auch ist es möglich auf Basis der Verteilung, Gruppen von Threads zu bilden, in denen sehr schnell geantwortet wird, oder eher langsamer.

Die Übersetzungsfortschritte durch die Daten sind gekennzeichnet durch immer wieder neue Tabellen, die am Ende in einer Visualisierung verdichtet werden. Aus den explorativen Erkundungen entstehen Reports, HTML-Seiten, die über Text und Grafik erläutern, welche Einschreibungen in die Daten passieren.

Über den folgenden Link ist beispielsweise die Tabelle der Threads zu sehen, sortiert nach der kürzesten Antwortverzögerung.

Oder eine experimentelle Web-App, die die Dynamik innerhalb eines Threads visualisiert.
Link zur App

Die beiden verlinkten Dokumente bauen aufeinander auf. Die Tabelle aus dem Report beinhaltet die eindeutigen Identifikationsnummern der Threads, die benötigt werden, um über den zweiten Link, in der App, sich die Dynamik innerhalb anschauen zu können.

Fragen, Kritik und Diskussion zu den hier verlinkten Dokumenten an martina.schories@uni-siegen.de