+36 30 966 14 59 (H)

info@medea.eu

Referenzen – Scanning

Reutlinger-Generalanzeiger_kleinReutlinger General-Anzeiger

Eines unserer Partnerunternehmen stellte Medea Services die hochauflösenden Scans des gesamten älteren Erscheinungsverlaufs obiger Zeitung auf Festplatten zur Verfügung. Es handelte sich um rund 680 000 Zeitungsseiten, die einige Terrabytes an Speicherplatz in Anspruch nahmen.

Anschliessend trainierte Medea Services die OCR-Software auf die im General-Anzeiger in den verschiedenen Erscheinungsepochen genutzten Schrifttypen. Hierzu gehörte auch Frakturschrift (bis rund 1944 verwendet). Durch das Training erhöht sich die OCR-Erkennungsrate. Anschliessend nutzten wir einen Verbund von rund 40 Rechnern um die äusserst rechenintensive OCR durchzuführen.

Nach mehren Monaten ständigem Rechnereinsatz konnte das Projekt inklusive der Nacharbeiten erfolgreich abgeschlossen werden.

Marbach_kleinDeutsches Literaturarchiv, Marbach

Medea Services holte über 1,3 Millionen bibliothekarische Katalogkarten in mehreren Fahrten beim Kunden ab.

Danach erfolgte das Scanning mit Dokumentenscannern in drei Schichten. Bei der OCR mussten nur gewisse Felder aus den Dokumenten erkannt werden. Die so gewonnenen Informationen importierten wir in die File Description-Felder des jpg-Formats.

Zur Bearbeitung gehörte auch das automatisierte Erkennen der Papierfarbe, auf die die Dokumente gedruckt waren, sowie von Barcodes.