DWork – Heidelberger Digitalisierungsworkflow
Für die Unterstützung der Arbeitsabläufe bei der Digitalisierung und der Webpräsentation der Werke setzt die Universitätsbibliothek Heidelberg die Eigenentwicklung DWork – Heidelberger Digitalisierungsworkflow ein.
Dabei unterstützt die Software als Web-Applikation sämtliche Einzelschritte des Workflows von der Metadatenerstellung, über die Scanverarbeitung (inkl. Bildkonvertierung und automatische Texterkennung), die Erstellung der Webpräsentation bis hin zur Archivierung der Scans und Metadaten.
Bei der Konzeption von DWork stand neben der Umsetzung der von der Deutschen Forschungsgemeinschaft (DFG) vorgegebenen Richtlinien die Entwicklung einer leicht bedienbaren, transparenten Eingabeoberfläche im Vordergrund.
Workflow, Module und technische Anforderungen
Die einzelnen Schritte im Workflow (Allgemein – Bibliographie – Sequenz – Struktur – Konvertierung + OCR – Export - Archivierung) werden über ein Karteikartensystem aufgerufen. Der Forschritt im Arbeitsablauf wird über ein Ampelsystem sichtbar gemacht, so dass jederzeit ein einfacher Überblick möglich ist.
Technisch besteht die Software aus drei Modulen:
- Digitalisierungsworkflow
- Präsentation
- Archivierung
Die Software ist in PERL programmiert. Weitere Softwarevoraussetzungen sind:
- Webserver: Apache 2.x
- Datenbank: MySQL 5.x
- Volltextsuche: SOLR
OCR-Verarbeitung
Für die OCR-Verarbeitung kommt der Abbyy Finereader für Linux zum Einsatz.
Weitere Informationen
- Workflow und eingesetzte Technik im Digitalisierungszentrum der UB Heidelberg
- Übersicht der digitalisierten Bände: „Heidelberger historische Bestände - digital”.
Ansprechpartner
Dr. Thomas Wolf
Leiter Digitalisierungszentrum
Dr. Maria Effinger
Leiterin Abteilung Handschriften und Alte Drucke
Zentrales Projektmanagement
Technische Ansprechparter
Leonhard Maylein
Leiter Informationstechnologie
Jochen Barth
DWork-Entwickler
