[[library_workflows|↩ Library Workflows]] ===== Standards von Digitalisaten ===== **Die Erstellung von Digitalisaten unterliegt bestimmten Anforderungen, etwa an Image-Qualität und Auflösung. Diese Standards sind hier beschrieben und im Sinne der Nachhaltigkeit der Digitalisierung stets zu beachten.** === Farbtiefe === **Es sollte möglichst jede Vorlage farbig gescannt werden. Dies gilt auch für Bücher ohne Abbildungen (insbesondere Rara). Graustufenscans werden nur von Mikroformen als Vorlagen erstellt. Im Sinne einer besseren Lesbarkeit sind sie bitonalen Scans vorzuziehen.** == 24 Bit RGB == Geräte, die farbige Scans unterstützen: * [[canon_eos_5d_mkiii | Canon EOS-5D Mark III]]: für Bücher (insbesondere Rara) * [[Epson 1640 XL]]: für Bücher, Zeitungsartikel, flache Vorlagen * [[Nikon Supercoolscan 4000 ED]]: für Dias und Negativstreifen == 8 Bit Graustufen == * als Scanner dient der Mikroformenscanner [[nextscan_-_mikroformscanner]|nextscan]] === File-Format === **Grundregel: Gescannt wird im TIFF-Format. Die TIFF-Files werden [[archiv|archiviert]]. Für die [[Online]]-Version eines Dokuments werden von den Rohdaten JPG-Files erstellt.** * TIFF: immer ohne Kompression (kein LZW oder sonstiges) * CR2: Die [[canon_eos_5d_mkiii|Canon ]]-Kamera nutzt ein kameraeigenes File-Format: CR2. Dieses wird bei der [[canon_post|Nachbearbeitung]] in DNG und TIFF konvertiert * DNG: offenes RAW-Format * JPG: i.d.R. mit Photoshop erstellen * i.d.R. Qualitätsstufe 9 (Scale-o-mat 100 %) * Baseline Standard === Auflösung === **Grundregel: gescannt wird mit __600 dpi__. Von dieser Grundregel muss leider oftmals abgewichen werden, da die vorhandene Technik für viele Vorlagen nicht ausreicht.** 600 dpi erreichen folgende Geräte: * [[Epson 1640 XL]]: scannt A3 mit bis zu 1600 dpi (nicht interpoliert) * ist aber i.d.R. nicht benutzbar für alte Bücher * [[Canon EOS-1 DS Mark III]] schafft 600 dpi bis zu einer Kantenlänge der Vorlage von ca. 19 cm (4500x3000-Pixel-Chip) * die meisten Bücher sind größer als dieses Format, die Auflösung liegt i.d.R. zwischen 400 und 500 dpi Die Rohdaten werden in der Ausgangsauflösung [[archiv|archiviert]]. Die [[Online]]-Version wird i.d.R. auf 300 dpi herunterskaliert. === Erscheinungsbild === == Rand == * um die Vorlage wird stets ein schmaler schwarzer Rand gelassen, damit man sieht, dass nichts abgeschnitten ist * i.d.R. wird eine schwarze Pappe hinter die Vorlage gelegt, damit der Rand gleichmäßig schwarz ist == Ausrichtung == * Vorlagen werden immer gerade ausgerichtet, d.h. parallel zum Rand * das kann dazu führen, dass der Textblock im Image schief ist, wenn er auch in der Vorlage nicht parallel zum Seitenrand gedruckt ist * dies ist in Kauf zu nehmen, denn der originale Eindruck soll bewahrt werden == Kontrast == * gute Lesbarkeit ist zwar erwünscht, doch sind im Sinne der Bildplausibilität übertriebene Kontrast-Einstellungen zu vermeiden * auf keinen Fall dürfen weiße Höfe (Überbelichtung) zu sehen sein - Weißwert eines jeden Pixels stets unter 96% == Schärfe == * Images müssen ebenfalls aus Gründen der Lesbarkeit oft nachgeschärft werden * Bewährt hat sich dabei Photoshops "Unsharp mask" (Einstellungen: 100, 1, 2) bzw. "Selektives Scharfzeichen" * Auch hier sind übertriebene Einstellungen zu meiden (führt zu weißen Höfen um die Buchstaben), Standardeinstellung bei 90 === Daten-Ablage === == TIFF-Daten == Die Ordnerstruktur für alle Dokumente sieht folgendermaßen aus: * Oberordner mit [[id-vergabe|ID-Nummer]] * 'raw': enthält die TIFF bzw. DNG-Daten (bei Canon) der ersten Bearbeitungsstufe (Roh-Daten) * 'user': enthält Tiff-Daten einer möglichen zweiten Bearbeitungsstufe (Roh2-Daten) * 'info': enthält Refernzbilder und immer ein readme.txt (gemäß Vorlage auf jedem Digigroup-Rechner) Bei einem Dokument, das mit dem [[Epson 1640 XL]] oder der [[nextscan_-_mikroformscanner]|nextscan]] digitalisiert wurde, gibt es nur einen info- und einen raw-Folder (nur eine Bearbeitungsstufe). == JPG-Daten == Die Ordnerstruktur hängt von den Anforderungen der Projekte ab. I.d.R. lautet sie: * Oberordner mit [[id-vergabe|ID-Nummer]] * 'pageimg': enthält die auf 300 dpi herunterskalierten JPG-Bilder des Dokuments