Eine Pipeline zur Digitalisierung tabellenbasierter Fundmünzdaten aus PDF-Dokumenten

Autor/innen

DOI:

https://doi.org/10.17879/ozean-2020-2778

Abstract

Dieser Aufsatz beschreibt ein Verfahren, das es ermöglicht, textbasierte Fundmünzdaten zu extrahieren und in RDF zu übertragen. Entwickelt wurde das Verfahren im Rahmen einer Masterarbeit. Als Grundlage dienen die Publikationen des Projektes »Die Fundmünzen der Römischen Zeit in Deutschland (FMRD)«. In dem Beitrag wird auf die Herausforderung einer solchen Digitalisierung eingegangen und anschließend anhand eines Beispielmünzkomplexes ein Lösungsweg angeboten. Dieser Lösungsweg stellt eine aus mehreren Skripten bestehende Pipeline dar, die es ermöglicht, aus einem PDF die Daten als Text auszugeben, über das Zwischenformat CSV zu modifizieren und anschließend als RDF auszugeben.

Downloads

Veröffentlicht

2020-05-09

Zitationsvorschlag

Kissinger, T. (2020). Eine Pipeline zur Digitalisierung tabellenbasierter Fundmünzdaten aus PDF-Dokumenten. Online Zeitschrift Zur Antiken Numismatik, 2, 5–19. https://doi.org/10.17879/ozean-2020-2778
صندلی اداری سرور مجازی ایران Decentralized Exchange

Ausgabe

Rubrik

Artikel
فروشگاه اینترنتی