KHI: TIf Einzelseiten, Inhaltsverzeichnisse, Druckwerke 17.-18. Jh. aber auch Handschriften (heraldische Schriften), Bedarf: Auszeichnung/Annotationen von Einzelelementen auf Bildern, Metadaten als linked-open Daten (Abbildung über IIIF), Funktion goobi.workflow: Crowdsourcing für Bildelemente; MD im BVB (ohne Inhaltsverzeichnisse), intensive bibliographische Erschließung Drucke 16. Jahrhunderrts, Münzbücher (Transkriptionen im TEI-Format → Übernahme aus MPIWG, Sprungmarken zu externen Ressourcen, Census); kodikologische Daten (Access-Datenbank, xml-Ausgabeformat): Ziel Integration in Goobi als Linked Data, mehrsprachige Suche (Feldnamen), Beschreibung der Inhalte auf Dt., 20-30 Felder gefüllt mit einem Vokabular (ca. 360 Begriffe); Integration der Vokabularien in Goobi: Vorgehensweise zweistufig; weitere Bento-Datenbank (Momento?) für Tablets, Ausgabe CSV/Excel-Format, Photomaterial, Untersuchung Restaurierung (nicht öffentlich) – für Phase 2
OCR: Einrichtung, Kosten pro Bild, Angebot für OCR
OCR-Engine: Tesseract; Generierung von ground-truth-Daten
Goobi.Viewer: Angebot für Unterstützung RTL, Blättern
Preis pro Seite
METS/MODS
aus Goobi.Workflow: vollständig, “aufheben”
aus Goobi.Viewer: konform, ggf. Auswahl
MPIWG
Anzeige im Kontext DLC
Integration
DRI
Konzentration auf Rara, Karten
Video, Audio, Herbarblätter später
Konfiguration
Goobi.Viewer: eine Instanz für alle Teilnehmer?
Goobi.Workflow: mehrfache INstanzen? Admin?
MPIWG → eigene Instanz?
Besprechung
MPIeR: Footer
PID-Management: Umstellung der Handles (Werkebene)
Weiterleitung
URLs
Berücksichtigung beim Datenimport
Granularität?
Empfehlung: pro Werk
DOI
Ausgabe der Lizenz, Rechteinformation
Automatische Vergabe von URNs, Handles?
Ansprechpartner für ePIC, API
MPIeR
verschiedene Digitalisierungsvorhaben, DFG-Projekte, Sammlungen: DLC, nicht-DLC, Archiv Vatikan; Priorität: 1. DLC, 2. restliche Sammlungen, außerhalb DLC; Produktion, wenn Migration abgeschlossen ist; Einspielen JPGs, Tiff ggf. später
Bestandsaufnahme Daten (Intranda)
Bsp. Linz (Panorama, Karten)
Tif, Größe
Kataloge
Mapping, Encoding muss überprüft werden
MPIWG
Überprüfung der originalschriftlichen Zeichen (Anzeige im Interface, Ausgabe in METS/MODS)
→ Intranda: Mapping Felder, Publikationstypen
Plugin: Aktualisierung der Daten in Goobi aus Bibliothekskatalogen und anderen Quellen
kodikologische Daten: wie Normdatensätze? Aktualisierung? Integration in Goobi.workflow/.viewer
Pagebreak
Originalschriftliche Zeichen
Übernahme aus Katalog; Mapping kann individuell konfiguriert werden (seitens Intranda, GBV)
Frage: Migration von Identifiern (aus DLC, MPIWG?)
Integration Volltexte
TEI? ECHO-XML?
Rücksprache mit KT
Meilensteine, Prioritäten
Kosten?
Instanzen?
Hosting?
RS mit GWDG (Architektur)
Viewer?
Vorschlag Intranda (MPG-Layout)
Layout, pragmatisch
2 Beispiele digitaler Bibliotheken
Bewertung der Datenbasis??
Facettierung?
individuell nach Einrichtung?
Beispiele!
Intranda, Nachfrage bei DOI
Spezifikation der Workflows
Aufsetzen durch Intranda für Import
Schulungen vor Ort
Regel 2 Tage, Anwendung, Projektmanagement, Administration
Spezifika
Angebot?
Finanzierung, Vertragsabschluss
Goobi.Viewer
Übersetzungen → Ital.
RTL-Unterstützung
Merklisten/Sammlungen
IIIF: Image, Presentation, Change Discovery API
Aufnahme Search API
Toolbar Helligkeit/Kontrast → im Mirador, Link
Zitierlink Bildausschnitte, Kontextbezogen
Bildähnlichkeitssuche?
Ergebnisanzeige: Images für Untertreffer
MPIWG: Vorab-Installation
Einbinung von Goobi.Workflow/.Viewer in die DRI
Verbindung Goobi - Repository
a) Vorstellung MPIWG
Welche Daten liegen insgesamt vor?
Einspeisung: laufend, retrospektiv (ca. 100 TB auf Bandarchiv im GNZ)
überwiegend Bilddateien von Rara, Karten, Manuskripten, Herbarien (Formate: tif)
Master: Tif-Einzelseiten
im allgemeinen: kein OCR
Rohformate: DNG?
Metadaten
für Rara, Karten und Manuskripte im GVK
für Spezialsammlungen (Delisle-Korrespondenz und Adanson-Herbarblätter) in Excel-Tabellen
Besonderheit: Berücksichtigung originalschriftlicher Angaben (Chinesisch usw.) bei der Datenübernahme aus dem GVK, beim Retrieval in Goobi.Viewer usw.
Audiodateien (Formate: aiff, mp3, wav)
Metadaten?
Videodaten (Formate: mov, mp4, mpeg)
Metadaten?
xml-Volltexte ?
–> Priorisierung
laufende Produktion (Rara, Karten)
Volltexte (Format?, Anfrage bei KT)
retrospektiv 100 TB
Audio-Videodaten
Spezialsammlungen (Delisle, Herbarblätter)
In welchen Formaten oder auf anderen Systemen (außerhalb DLC) liegen noch weitere Daten vor und sollen diese auch mit überführt werden?
Welche Priorität haben die eigenen Daten selbst und speziell im Vergleich zum gesamten Vorhaben?
Rara und Karten haben oberste Priorität
Wie sieht die (Wunsch-) Vorstellung zur Zeitplanung aus?
zuerst: Bearbeitung der Rara, Karten und Manuskripte in Goobi.Workflow und Anzeige in Goobi.Viewer
später: Audio/Videos, Volltexte und Spezialsammlungen (Adanson, Delisle)
b) Vorstellung von intrandas erster Bestandsaufnahme der Daten
erste Einschätzungen
Metadaten für Rara und Karten: Handling originalschriftlicher Zeichen !
Übernahme aus GVK, Aufbereitung in Goobi.Workflow (MD Editor), Anzeige und Suche im Goobi.Viewer
c) Zusammenstellung von Erwartungen
Welche Erwartungen bestehen hinsichtlich des Projektablaufs?
Massenimport von Binär- und Metadaten (Rara, Karten usw.)
Generierung von Volltexten mittels OCR
adäquate Anzeige und Suche in Goobi.Viewer
Welche Erwartungen bestehen neben der existierenden Funktionalität an die Software?
Für MPIWG: Integration von Goobi-Workflow in die neue DRI (Repository)