Visualisierung und Analyse von textuellen Stream Clustering Daten zur Detektion manipulativer Kampagnen in Sozialen Medien

Antragstellerin: Janina Pohl
Projektbeteiligte: PD Dr.-Ing. Christian Grimme, Dennis Assenmacher, M.Sc. (fachliche Beratung des Projektfortschritts)
Fachbereich, Studienrichtung: FB 04; Institut für Wirtschaftsinformatik, Information Systems
Projekttitel: Visualisierung und Analyse von textuellen Stream Clustering Daten zur Detektion manipulativer Kampagnen in Sozialen Medien
Fördersumme: 456,80 Euro
Kontakt: Janina Pohl

Projektbeschreibung
Dieses Projekt hatte zum Ziel, ein Dashboard zu entwickeln, mit dem es möglich ist, mithilfe des Zusammenspiels von unüberwachten Algorithmen als auch der menschlichen Intuition, gezielte Meinungsmanipulation und falsche Identitäten in dem Sozialen Netzwerk Twitter zu entdecken. Das vorrangige Ziel des Projekts war es, den Prototypen – entwickelt von Assenmacher et al. – weiterzuentwickeln. Dazu wurde zuerst wie geplant in AP0 eine umfassende Literaturrecherche durchgeführt, um weitere Metriken und Visualisierungsmethoden zu finden, die im Dashboard genutzt werden könnten. Hier haben sich unter anderem die Hashtag-Analyse sowie die genauere Betrachtung der Syntax, d.h. der Verwendung von z. B. Großbuchstaben, als sinnvoll erwiesen.

In AP1 sollte ein einheitliches Integrationsschema entwickelt werden, um die im Laufe des Projekts gekauften Daten von Twitter effizient abspeichern und nutzen zu können. Unvorhergesehen hat Twitter jedoch seine Angebotsstruktur in der Projektlaufzeit gravierend geändert, sodass keine Einigung erzielt werden konnte. Stattdessen wurde ein kostenloser Twitter-Stream genutzt, um 1% der Daten in Deutschland in der Woche der Veröffentlichung der Corona-Warn-App zu streamen. Dieser sehr viel kleinere Datensatz wurde später zum Testen des Dashboards genutzt. Dieses Arbeitspaket ist deswegen nicht so hoch priorisiert worden, wie anfangs gedacht.

In AP2 und AP3 sollte das Dashboard abwechselnd konzeptionell und visuell überarbeitet und anschließend an dem genannten Datensatz getestet werden, um seine Funktionalität einschätzen zu können. Mit Hilfe weiterer Literaturrecherchen zum Aufbau eines Dashboards sowie der Nutzung der Daten aus der Veröffentlichung der Corona-Warn-App konnte dieses Ziel erreicht werden.

Sichtbar gemacht im nationalen und internationalen Vergleich wurde das Dashboard, indem es wie geplant auf der Konferenz HCII – Human Computer Interaction International – vorgestellt wurde. Obwohl die Konferenz nur online stattfand, war es möglich, es internationalen Wissenschaftlern zu präsentieren und Feedback zu erhalten. Weiterhin ist der Code des Dashboards öffentlich auf GitHub verfügbar, sodass er von anderen Wissenschaftlern, die sich für das Thema interessieren, angesehen werden kann und es eine zentrale Anlaufstelle für Verbesserungsvorschläge gibt.

Insgesamt wurde das allgemeine Projektziel weitestgehend erreicht, da das Dashboard effektiv weiterentwickelt wurde. So war ein menschlicher Nutzer in der Lage, mithilfe des Dashboards in dem Zeitraum der Veröffentlichung der Corona-Warn-App einen Manipulationsversuch der öffentlichen Meinung nachzuweisen. Durch immer neue Methoden der Propaganda wird es in Zukunft jedoch spannend und interessant bleiben, die Kapazitäten des Dashboards weiter auszuschöpfen.

Ich bedanke mich bei allen Beteiligten für die Unterstützung!