Digitale Methoden & Tools, Veranstaltungen
Schreibe einen Kommentar

SCDH-Schulung Vernetztes Wissen im Semantic Web – Studierendenbericht

Am 26. November 2021 wurde am Service Center für Digital Humanities der WWU ein Workshop zum Thema „Vernetztes Wissen im Semantic Web – digitale Methoden der Wissensvernetzung“ unter der Leitung von Dr. Immanuel Normann veranstaltet, der sowohl Forschenden der WWU als auch Studierenden des Zertifikats Digital Humanities offenstand. Aufgrund der derzeitigen Coronasituation fand der Workshop in einem Hybridformat statt.

Zunächst gab es eine theoretische Einführung: Beim Semantic Web geht es darum, Wissensgraphen zu erstellen, in denen beispielsweise Autor:innen, Charaktere, Werke und Orte miteinander verknüpft werden. Dazu wurde zuerst ein Graph grafisch erstellt. Die Teilnehmenden konnten dies selber mit dem Programm „yEd Live“ erproben.

Nach einem Gastvortrag von Florian Thiery zum Thema „Semantic Web und LOD in der digitalen Archäologie: Ein Blick in die Praxis“ und einer Mittagspause ging es darum, die grafisch dargestellten Daten digital in sogenannten RDF-Tripeln und Linked Open Data zu erfassen. Dabei ergaben sich einige interessante Fragen, die gemeinsam diskutiert wurden: Wie sollen Personen kategorisiert werden, von denen man nicht genau weiß, ob sie gelebt haben und ein bestimmtes Werk verfasst haben? Wie verhält es sich mit Orten, an denen sich die Handlung eines Werks zuträgt, die zwar den Namen eines real existierenden Ortes tragen, aber an sich rein fiktiv sind? Wie viele Elemente können oder sollten miteinander verknüpft werden, sodass es einerseits sinnvoll, aber andererseits auch noch übersichtlich ist? Kann es einen Anspruch auf Vollständigkeit geben?

Um zu verdeutlichen, was erarbeitet wurde, führe ich hier mein Beispiel-Ergebnis des Workshop-Tages an, das ich noch ein wenig erweitert habe:

Ich habe die Kategorien „Autor“, „Werk“ und „Nationalität“ definiert, die alle orange dargestellt sind. Zur „Nationalität“ gehören zusätzlich die Unterkategorien „Schweden“, „Norwegen“, und „Island“, gelb gefärbt. Im RDF-Schema gibt es Tripel mit jeweils einem sogenannten Subjekt, einem Prädikat und einem Objekt. Die Kategorien können Subjekt oder Objekt sein. Ich habe zwei verschiedene Prädikate und zwei Pfeilformen verwendet. An Pfeile mit einer blau ausgefüllten Pfeilspitze können Prädikate hinzutreten, um die Beziehung zwischen Subjekt und Objekt zu definieren. Also gibt es die Tripel „Autor verfasst Werk“ und „Autor kommt_aus Nationalität“. (Hinweis: Da in der anschließenden Umsetzung für die digitale Erfassung keine Leerzeichen innerhalb eines Elements von einem Tripel existieren dürfen, habe ich Unterstriche verwendet.) Dementsprechend habe ich meine Beispielautoren mit ihren Werken und Nationalitäten verknüpft.

An den Pfeilen ohne ausgefüllte Spitze existieren keine (zusätzlichen) Prädikate, weil ich diese Pfeilform als reine Zuordnung definiert habe. Sie bedeuten so viel wie „ist ein/eine“. In der grafischen Darstellung in yEd Live gibt es die Möglichkeit, verschiedene Darstellungsformen für den Graphen auszuwählen, das hier verwendete Layout heißt „hierarchisch“. Ich habe auch andere Layouts ausprobiert, fand aber, dass die Übersichtlichkeit sich dadurch nicht verbessert.

Für die digitale Umsetzung müssen im Editor zunächst Präfixe definiert werden, die einen URI (Unified Ressource Identificator), ähnlich einer URL, besitzen. In dieser Übung habe ich ausgedachte URIs benutzt.

Beispiele:

prefix c: http://beispiel.de/classes

prefix p: http://beispiel.de/properties

prefix : http://beispiel.de/individuals

Als nächstes können dann mit den Präfixen die Kategorien („classes“) und Prädikate („properties“) festgelegt werden. Die Definition eines Prädikats beinhaltet drei Aspekte: die Bestimmung als Prädikat („ObjektProperty“) und von wo nach wo es reicht bzw. sich bezieht, beispielsweise vom Autor zum Werk.

Beispiele:

c:Nationalität a rdfs:Class .

c:Island rdfs:subClassOf c:Nationalität .

p:verfasst a olw:ObjectProperty .

p:verfasst rdfs:domain c:Autor .

p:verfasst rdfs:range c:Werk .

Anschließend habe ich alle weiteren konkreten Zuordnungen getätigt.

Beispiele:

:Snorri_Sturluson a c:Autor .

:Snorri_Sturluson p:kommt_aus c:Island .

:Die_Edda_des_Snorri_Sturlurson a c:Werk .

:Snorri_Stulurson p:verfasst :Die_Edda_des_Snorri_Sturlurson .

Diese digitale Umsetzung kann – nach einer SyntaxÜberprüfung durch den RDF turtle validator – wiederum in ein Programm eingelesen und von diesem als Graph ausgegeben werden, wobei es zahlreiche Darstellungsmöglichkeiten gibt: Es kann nach Kategorien oder konkreten Stichwörtern gefiltert und ausgewählt werden, was alles angezeigt werden soll. Per Klick können Bestandteile expandiert oder eingeklappt werden.

Diese digitale Umsetzung ist deshalb interessant, weil sie die Suche nach bestimmten Aspekten ermöglicht und alle Verknüpfungen eines einzelnen Suchbegriffs angezeigt werden können. Dies ist beispielsweise in „The Linked Open Data Cloud“ oder bei „Wikidata“ möglich. Hier bestehen natürlich viel mehr Verbindungen, und es gibt eine Fülle mehr an Kategorien. Im Workshop konnte dieses Themenfeld aus Zeitgründen nicht genauer behandelt werden, aber auch mit dem erhaltenen Einblick zeigt sich, wie weitreichend und nützlich das Semantic Web ist.

Zum eigenen Projekt

Gesa Allerheiligen

Die nachfolgende Vorstellung eines exemplarischen Starterprojekts dient der Illustration der Arbeitsergebnisse. Um sich ganz auf die methodische Umsetzung fokussieren zu können, habe ich für das eigene Projekt inhaltlich auf eine mir vertraute Materie zurückgegriffen: die Diskographie der Band Little Mix. In den Jahren 2011 bis 2020 bestand die Band aus den vier Mitgliedern Jade Thirlwall, Leigh-Anne Pinnock, Perrie Edwards und Jesy Nelson. Jesy Nelson stieg 2020 aus der Band aus, sodass sie nur rudimentär am Album Confetti (2020) beteiligt war. Ziel des Projekts ist die Darstellung der vernetzten Diskographie der Band – zumindest fragmentarisch – am Beispiel der beiden zuletzt erschienenen Alben samt einer Auswahl darin enthaltener Lieder. Ich möchte darstellen, welche Personen an welchen Alben beteiligt und bei welchen Liedern sie als Songwriter tätig waren.

LiedErscheint auf: AlbumSongwriter (Person)
Not A Pop SongConfettiJade Thirlwall
HolidayConfetti 
Gloves UpConfettiPerrie Edwards
Confetti feat. SaweetieConfetti 
Woman Like MeLM 5 
NoticeLM 5Leigh-Anne Pinnock
MotivateLM 5 
AlbumBeteiligte Personen
ConfettiJade ThirlwallLeigh-Anne PinnockPerrie Edwards 
LM 5Jade ThirlwallLeigh-Anne PinnockPerrie EdwardsJesy Nelson
Im Projekt genutzte Daten (tabellarische Darstellung).
Grafische Darstellung im yEd Graph Editor
Syntax im Editor

Bei diesem Projekt handelt es sich um eine additive Form der Darstellung desselben Wissens aus einer Quellendatenbank (s. tabellarische Darstellung). Dieses Wissen ist auf aktuelle, eindeutig kategorisierbare Phänomene begrenzt – etwaige Wissenslücken müssen nicht durch Nachforschung gefüllt werden. Die Klassen sind zumeist auch urheberrechtlich abgesichert, sodass eine Diskussion um Zuordnungen und Klassen in diesem Falle vernachlässigbar ist.

Zu beachten ist jedoch, dass selbst bei diesem exemplarischen Projekt mit Einschränkungen umgegangen werden muss: Es lässt sich nur angeben, ob eine Person als Songwriter fungiert oder nicht. Diese dualistische Herangehensweise übersieht unterschiedlich große Anteile am Songwriting-Prozess, der in den Credits für gewöhnlich durch die Reihenfolge, in der die Namen angegeben werden, näherungsweise widergespiegelt wird. Im Weiteren sollten folglich die gesamten Angaben aus den Credits einbezogen werden. Das würde nicht nur eine höhere Genauigkeit, sondern auch eine Erweiterung des Netzes um zahlreiche weitere Personen zur Folge haben. Diese Personen sind auch für andere Sänger:innen tätig, sodass das Netz sich rasch über die gesamte Popmusik des 21. Jahrhunderts erstrecken könnte. Der Anspruch an Vollständigkeit ist an dieser Stelle kritisch zu reflektieren. Bei der grafischen Darstellung könnten außerdem seltene Verknüpfungen zwischen verschiedenen Künstler:innen oder auch Ballungen, d.h. stärker ausgeprägte Verbindungen, eindeutig visuell erkennbar werden. Damit könnte auch anhand dieses Beispielprojekts ein Forschungsinteresse entstehen.

Schreibe einen Kommentar