User Tools

Site Tools


digi_standards

↩ Library Workflows

Standards von Digitalisaten

Die Erstellung von Digitalisaten unterliegt bestimmten Anforderungen, etwa an Image-Qualität und Auflösung. Diese Standards sind hier beschrieben und im Sinne der Nachhaltigkeit der Digitalisierung stets zu beachten.

Farbtiefe

Es sollte möglichst jede Vorlage farbig gescannt werden. Dies gilt auch für Bücher ohne Abbildungen (insbesondere Rara). Graustufenscans werden nur von Mikroformen als Vorlagen erstellt. Im Sinne einer besseren Lesbarkeit sind sie bitonalen Scans vorzuziehen.

24 Bit RGB

Geräte, die farbige Scans unterstützen:

8 Bit Graustufen
  • als Scanner dient der Mikroformenscanner nextscan

File-Format

Grundregel: Gescannt wird im TIFF-Format. Die TIFF-Files werden archiviert. Für die Online-Version eines Dokuments werden von den Rohdaten JPG-Files erstellt.

  • TIFF: immer ohne Kompression (kein LZW oder sonstiges)
  • CR2: Die Canon -Kamera nutzt ein kameraeigenes File-Format: CR2. Dieses wird bei der Nachbearbeitung in DNG und TIFF konvertiert
  • DNG: offenes RAW-Format
  • JPG: i.d.R. mit Photoshop erstellen
    • i.d.R. Qualitätsstufe 9 (Scale-o-mat 100 %)
    • Baseline Standard

Auflösung

Grundregel: gescannt wird mit 600 dpi. Von dieser Grundregel muss leider oftmals abgewichen werden, da die vorhandene Technik für viele Vorlagen nicht ausreicht.

600 dpi erreichen folgende Geräte:

  • Epson 1640 XL: scannt A3 mit bis zu 1600 dpi (nicht interpoliert)
    • ist aber i.d.R. nicht benutzbar für alte Bücher
  • Canon EOS-1 DS Mark III schafft 600 dpi bis zu einer Kantenlänge der Vorlage von ca. 19 cm (4500×3000-Pixel-Chip)
    • die meisten Bücher sind größer als dieses Format, die Auflösung liegt i.d.R. zwischen 400 und 500 dpi

Die Rohdaten werden in der Ausgangsauflösung archiviert. Die Online-Version wird i.d.R. auf 300 dpi herunterskaliert.

Erscheinungsbild

Rand
  • um die Vorlage wird stets ein schmaler schwarzer Rand gelassen, damit man sieht, dass nichts abgeschnitten ist
  • i.d.R. wird eine schwarze Pappe hinter die Vorlage gelegt, damit der Rand gleichmäßig schwarz ist
Ausrichtung
  • Vorlagen werden immer gerade ausgerichtet, d.h. parallel zum Rand
  • das kann dazu führen, dass der Textblock im Image schief ist, wenn er auch in der Vorlage nicht parallel zum Seitenrand gedruckt ist
    • dies ist in Kauf zu nehmen, denn der originale Eindruck soll bewahrt werden
Kontrast
  • gute Lesbarkeit ist zwar erwünscht, doch sind im Sinne der Bildplausibilität übertriebene Kontrast-Einstellungen zu vermeiden
    • auf keinen Fall dürfen weiße Höfe (Überbelichtung) zu sehen sein - Weißwert eines jeden Pixels stets unter 96%
Schärfe
  • Images müssen ebenfalls aus Gründen der Lesbarkeit oft nachgeschärft werden
  • Bewährt hat sich dabei Photoshops “Unsharp mask” (Einstellungen: 100, 1, 2) bzw. “Selektives Scharfzeichen”
  • Auch hier sind übertriebene Einstellungen zu meiden (führt zu weißen Höfen um die Buchstaben), Standardeinstellung bei 90

Daten-Ablage

TIFF-Daten

Die Ordnerstruktur für alle Dokumente sieht folgendermaßen aus:

  • Oberordner mit ID-Nummer
    • 'raw': enthält die TIFF bzw. DNG-Daten (bei Canon) der ersten Bearbeitungsstufe (Roh-Daten)
    • 'user': enthält Tiff-Daten einer möglichen zweiten Bearbeitungsstufe (Roh2-Daten)
    • 'info': enthält Refernzbilder und immer ein readme.txt (gemäß Vorlage auf jedem Digigroup-Rechner)

Bei einem Dokument, das mit dem Epson 1640 XL oder der nextscan digitalisiert wurde, gibt es nur einen info- und einen raw-Folder (nur eine Bearbeitungsstufe).

JPG-Daten

Die Ordnerstruktur hängt von den Anforderungen der Projekte ab. I.d.R. lautet sie:

  • Oberordner mit ID-Nummer
    • 'pageimg': enthält die auf 300 dpi herunterskalierten JPG-Bilder des Dokuments
digi_standards.txt · Last modified: 2020/10/10 14:13 by 127.0.0.1