====== Goobi-Workshop, 12.02. ====== * Protokoll * TeilnehmerInnen * Moderation * Vorstellung * MPIB * MPIWG (s. unten) * KHI: TIf Einzelseiten, Inhaltsverzeichnisse, Druckwerke 17.-18. Jh. aber auch Handschriften (heraldische Schriften), Bedarf: Auszeichnung/Annotationen von Einzelelementen auf Bildern, Metadaten als linked-open Daten (Abbildung über IIIF), Funktion goobi.workflow: Crowdsourcing für Bildelemente; MD im BVB (ohne Inhaltsverzeichnisse), intensive bibliographische Erschließung Drucke 16. Jahrhunderrts, Münzbücher (Transkriptionen im TEI-Format -> Übernahme aus MPIWG, Sprungmarken zu externen Ressourcen, Census); kodikologische Daten (Access-Datenbank, xml-Ausgabeformat): Ziel Integration in Goobi als Linked Data, mehrsprachige Suche (Feldnamen), Beschreibung der Inhalte auf Dt., 20-30 Felder gefüllt mit einem Vokabular (ca. 360 Begriffe); Integration der Vokabularien in Goobi: Vorgehensweise zweistufig; weitere Bento-Datenbank (Momento?) für Tablets, Ausgabe CSV/Excel-Format, Photomaterial, Untersuchung Restaurierung (nicht öffentlich) -- für Phase 2 * OCR: Einrichtung, Kosten pro Bild, Angebot für OCR * OCR-Engine: Tesseract; Generierung von ground-truth-Daten * Goobi.Viewer: Angebot für Unterstützung RTL, Blättern * Preis pro Seite * METS/MODS * aus Goobi.Workflow: vollständig, "aufheben" * aus Goobi.Viewer: konform, ggf. Auswahl * MPIWG * Anzeige im Kontext DLC * Integration * DRI * Konzentration auf Rara, Karten * Video, Audio, Herbarblätter später * Konfiguration * Goobi.Viewer: eine Instanz für alle Teilnehmer? * Goobi.Workflow: mehrfache INstanzen? Admin? * MPIWG -> eigene Instanz? * Besprechung * MPIeR: Footer * PID-Management: Umstellung der Handles (Werkebene) * Weiterleitung * URLs * Berücksichtigung beim Datenimport * Granularität? * Empfehlung: pro Werk * DOI * Ausgabe der Lizenz, Rechteinformation * Automatische Vergabe von URNs, Handles? * Ansprechpartner für ePIC, API * MPIeR * verschiedene Digitalisierungsvorhaben, DFG-Projekte, Sammlungen: DLC, nicht-DLC, Archiv Vatikan; Priorität: 1. DLC, 2. restliche Sammlungen, außerhalb DLC; Produktion, wenn Migration abgeschlossen ist; Einspielen JPGs, Tiff ggf. später * Bestandsaufnahme Daten (Intranda) * Bsp. Linz (Panorama, Karten) * Tif, Größe * Kataloge * Mapping, Encoding muss überprüft werden * MPIWG * Überprüfung der originalschriftlichen Zeichen (Anzeige im Interface, Ausgabe in METS/MODS) * -> Intranda: Mapping Felder, Publikationstypen * Plugin: Aktualisierung der Daten in Goobi aus Bibliothekskatalogen und anderen Quellen * kodikologische Daten: wie Normdatensätze? Aktualisierung? Integration in Goobi.workflow/.viewer * Pagebreak * Originalschriftliche Zeichen * Übernahme aus Katalog; Mapping kann individuell konfiguriert werden (seitens Intranda, GBV) * Frage: Migration von Identifiern (aus DLC, MPIWG?) * **Integration Volltexte** * TEI? ECHO-XML? * Rücksprache mit KT * Meilensteine, Prioritäten * Kosten? * Instanzen? * Hosting? * RS mit GWDG (Architektur) * Viewer? * Vorschlag Intranda (MPG-Layout) * Layout, pragmatisch * 2 Beispiele digitaler Bibliotheken * Bewertung der Datenbasis?? * Facettierung? * individuell nach Einrichtung? * Beispiele! * Intranda, Nachfrage bei DOI * Spezifikation der Workflows * Aufsetzen durch Intranda für Import * Schulungen vor Ort * Regel 2 Tage, Anwendung, Projektmanagement, Administration * Spezifika * Angebot? * Finanzierung, Vertragsabschluss * Goobi.Viewer * Übersetzungen -> Ital. * RTL-Unterstützung * Merklisten/Sammlungen * IIIF: Image, Presentation, Change Discovery API * Aufnahme Search API * Toolbar Helligkeit/Kontrast -> im Mirador, Link * Zitierlink Bildausschnitte, Kontextbezogen * Bildähnlichkeitssuche? * Ergebnisanzeige: Images für Untertreffer * **MPIWG: Vorab-Installation** * Einbinung von Goobi.Workflow/.Viewer in die DRI * Verbindung Goobi - Repository * a) Vorstellung MPIWG * **Welche Daten liegen insgesamt vor?** * Einspeisung: laufend, retrospektiv (ca. 100 TB auf Bandarchiv im GNZ) * überwiegend Bilddateien von Rara, Karten, Manuskripten, Herbarien (Formate: tif) * Master: Tif-Einzelseiten * im allgemeinen: kein OCR * Rohformate: DNG? * Metadaten * für Rara, Karten und Manuskripte im GVK * für Spezialsammlungen (Delisle-Korrespondenz und Adanson-Herbarblätter) in Excel-Tabellen * Besonderheit: **Berücksichtigung originalschriftlicher Angaben (Chinesisch usw.)** bei der Datenübernahme aus dem GVK, beim Retrieval in Goobi.Viewer usw. * Audiodateien (Formate: aiff, mp3, wav) * Metadaten? * Videodaten (Formate: mov, mp4, mpeg) * Metadaten? * xml-Volltexte ? * **--> Priorisierung** * laufende Produktion (Rara, Karten) * Volltexte (Format?, Anfrage bei KT) * retrospektiv 100 TB * Audio-Videodaten * Spezialsammlungen (Delisle, Herbarblätter) * **In welchen Formaten oder auf anderen Systemen (außerhalb DLC) liegen noch weitere Daten vor und sollen diese auch mit überführt werden?** * **Welche Priorität haben die eigenen Daten selbst und speziell im Vergleich zum gesamten Vorhaben?** * Rara und Karten haben oberste Priorität * **Wie sieht die (Wunsch-) Vorstellung zur Zeitplanung aus?** * zuerst: Bearbeitung der Rara, Karten und Manuskripte in Goobi.Workflow und Anzeige in Goobi.Viewer * später: Audio/Videos, Volltexte und Spezialsammlungen (Adanson, Delisle) * b) Vorstellung von intrandas erster Bestandsaufnahme der Daten * erste Einschätzungen * Metadaten für Rara und Karten: Handling originalschriftlicher Zeichen ! * Übernahme aus GVK, Aufbereitung in Goobi.Workflow (MD Editor), Anzeige und Suche im Goobi.Viewer * c) Zusammenstellung von Erwartungen * Welche Erwartungen bestehen hinsichtlich des Projektablaufs? * Massenimport von Binär- und Metadaten (Rara, Karten usw.) * Generierung von Volltexten mittels OCR * adäquate Anzeige und Suche in Goobi.Viewer * Welche Erwartungen bestehen neben der existierenden Funktionalität an die Software? * Für MPIWG: Integration von Goobi-Workflow in die neue DRI (Repository)