SIGS Kernkorpus

Die Annotation der Texte umfasst:

  • Tokenisierung (graphisch und syntaktisch)
  • POS-Tags
  • Lemmata
  • Belebtheitskategorien
  • Einteilung in syntaktische Einheiten

Die Datengrundlage im Projekt bildeten frnhd. Hexenverhörprotokolle aus der Edition von Macha et al. (2005). Aus diesen wurde ein Kernkorpus von 18 Texten erstellt, die gleichmäßig über Raum und Zeit verteilt sind.

Zur Visualisierung des Korpus gibt es auch eine interaktive Karte.

Ort Region Zeit
Jever NW 1593
Meldorf NW 1618
Alme NW 1630
Perleberg NO 1588
Güstrow NO 1615
Stralsund NO 1630
Hamm MW 1592
Gaugrehweiler MW 1610
Lemberg MW 1630
Georgenthal MO 1597
Rosenburg MO 1618
Ostrau MO 1628
Riedlingen SW 1596
Günzburg SW 1613
Baden-Baden SW 1628
München SO 1600
Schweinfurt SO 1616
Bamberg SW 1628