‘Natural language processing‘ wie die automatische Klassifikation von Texten (und Bildern) unter Anwendung von AI und KI ist für die Auswertung umfangreicher Medienkorpora oder von Medienanalysen mit großen Stichproben wie bei Programm- und Medienqualitätsanalysen ein zielführendes und somit in der KMW ein immer wichtiger werdendes Arbeitsfeld.

Nach Klärung des Grundprinzips überwachter Klassifikationen und der notwendigen Vorarbeiten (Tagging/Tokenisierung) lernen wir im Kurs verschiedene Maschine-Learning-Algorithmen (wie: logreg., NB, Clusteranalyse aber auch CNN) kennen, wie diese in verschiedenen Programmierumgebungen (z. B. R oder WordStat) umgesetzt und verschiedenen Lösungen beurteilt werden können. Für die Übungen im Kurs stehen uns ein umfassender Datensatz aus einem Forschungsprojekt über Medienangebote für die lokale Information mit Transkriptionen der erhobenen Beiträge und manueller Kodierung nach einem Codebuch zur Medienqualitätsanalyse zur Verfügung, gerne könne aber auch eigene (Text)datensätze bearbeitet werden.

Literatur: Eine Liste mit Literaturhinweisen wird nach der ersten Sitzung zur Verfügung gestellt.

Prüfungsleistung: Kodierarbeit/ eigene Datenanalyse/ Projektkurzbericht

Kurs im HIS-LSF

Semester: ST 2025
ePortfolio: No