Goobi-Workshop, 12.02.

Protokoll
- TeilnehmerInnen
- Moderation
- Vorstellung
  - MPIB
  - MPIWG (s. unten)
  - KHI: TIf Einzelseiten, Inhaltsverzeichnisse, Druckwerke 17.-18. Jh. aber auch Handschriften (heraldische Schriften), Bedarf: Auszeichnung/Annotationen von Einzelelementen auf Bildern, Metadaten als linked-open Daten (Abbildung über IIIF), Funktion goobi.workflow: Crowdsourcing für Bildelemente; MD im BVB (ohne Inhaltsverzeichnisse), intensive bibliographische Erschließung Drucke 16. Jahrhunderrts, Münzbücher (Transkriptionen im TEI-Format → Übernahme aus MPIWG, Sprungmarken zu externen Ressourcen, Census); kodikologische Daten (Access-Datenbank, xml-Ausgabeformat): Ziel Integration in Goobi als Linked Data, mehrsprachige Suche (Feldnamen), Beschreibung der Inhalte auf Dt., 20-30 Felder gefüllt mit einem Vokabular (ca. 360 Begriffe); Integration der Vokabularien in Goobi: Vorgehensweise zweistufig; weitere Bento-Datenbank (Momento?) für Tablets, Ausgabe CSV/Excel-Format, Photomaterial, Untersuchung Restaurierung (nicht öffentlich) – für Phase 2
  - OCR: Einrichtung, Kosten pro Bild, Angebot für OCR
    - OCR-Engine: Tesseract; Generierung von ground-truth-Daten
  - Goobi.Viewer: Angebot für Unterstützung RTL, Blättern
  - Preis pro Seite
  - METS/MODS
    - aus Goobi.Workflow: vollständig, “aufheben”
    - aus Goobi.Viewer: konform, ggf. Auswahl
  - MPIWG
    - Anzeige im Kontext DLC
    - Integration
    - DRI
    - Konzentration auf Rara, Karten
    - Video, Audio, Herbarblätter später
  - Konfiguration
    - Goobi.Viewer: eine Instanz für alle Teilnehmer?
    - Goobi.Workflow: mehrfache INstanzen? Admin?
      - MPIWG → eigene Instanz?
      - Besprechung
    - MPIeR: Footer
    - PID-Management: Umstellung der Handles (Werkebene)
      - Weiterleitung
      - URLs
        
        Berücksichtigung beim Datenimport
      - Granularität?
        
        Empfehlung: pro Werk
      - DOI
    - Ausgabe der Lizenz, Rechteinformation
    - Automatische Vergabe von URNs, Handles?
      - Ansprechpartner für ePIC, API
  - MPIeR
    - verschiedene Digitalisierungsvorhaben, DFG-Projekte, Sammlungen: DLC, nicht-DLC, Archiv Vatikan; Priorität: 1. DLC, 2. restliche Sammlungen, außerhalb DLC; Produktion, wenn Migration abgeschlossen ist; Einspielen JPGs, Tiff ggf. später
- Bestandsaufnahme Daten (Intranda)
  - Bsp. Linz (Panorama, Karten)
    - Tif, Größe
  - Kataloge
    - Mapping, Encoding muss überprüft werden
    - MPIWG
      - Überprüfung der originalschriftlichen Zeichen (Anzeige im Interface, Ausgabe in METS/MODS)
        
        → Intranda: Mapping Felder, Publikationstypen
      - Plugin: Aktualisierung der Daten in Goobi aus Bibliothekskatalogen und anderen Quellen
      - kodikologische Daten: wie Normdatensätze? Aktualisierung? Integration in Goobi.workflow/.viewer
      - Pagebreak

Originalschriftliche Zeichen
- Übernahme aus Katalog; Mapping kann individuell konfiguriert werden (seitens Intranda, GBV)
Frage: Migration von Identifiern (aus DLC, MPIWG?)
Integration Volltexte
- TEI? ECHO-XML?
- Rücksprache mit KT

Meilensteine, Prioritäten
- Kosten?
- Instanzen?
- Hosting?
  - RS mit GWDG (Architektur)
- Viewer?
  - Vorschlag Intranda (MPG-Layout)
  - Layout, pragmatisch
  - 2 Beispiele digitaler Bibliotheken
- Bewertung der Datenbasis??
  - Facettierung?
  - individuell nach Einrichtung?
  - Beispiele!
- Intranda, Nachfrage bei DOI
- Spezifikation der Workflows
  - Aufsetzen durch Intranda für Import
  - Schulungen vor Ort
    - Regel 2 Tage, Anwendung, Projektmanagement, Administration
    - Spezifika
- Angebot?
  - Finanzierung, Vertragsabschluss
- Goobi.Viewer
  - Übersetzungen → Ital.
  - RTL-Unterstützung
  - Merklisten/Sammlungen
  - IIIF: Image, Presentation, Change Discovery API
    - Aufnahme Search API
  - Toolbar Helligkeit/Kontrast → im Mirador, Link
  - Zitierlink Bildausschnitte, Kontextbezogen
  - Bildähnlichkeitssuche?
  - Ergebnisanzeige: Images für Untertreffer

MPIWG: Vorab-Installation
- Einbinung von Goobi.Workflow/.Viewer in die DRI
- Verbindung Goobi - Repository

a) Vorstellung MPIWG
- Welche Daten liegen insgesamt vor?
  - Einspeisung: laufend, retrospektiv (ca. 100 TB auf Bandarchiv im GNZ)
  - überwiegend Bilddateien von Rara, Karten, Manuskripten, Herbarien (Formate: tif)
    - Master: Tif-Einzelseiten
    - im allgemeinen: kein OCR
    - Rohformate: DNG?
    - Metadaten
      - für Rara, Karten und Manuskripte im GVK
      - für Spezialsammlungen (Delisle-Korrespondenz und Adanson-Herbarblätter) in Excel-Tabellen
      - Besonderheit: Berücksichtigung originalschriftlicher Angaben (Chinesisch usw.) bei der Datenübernahme aus dem GVK, beim Retrieval in Goobi.Viewer usw.
  - Audiodateien (Formate: aiff, mp3, wav)
    - Metadaten?
  - Videodaten (Formate: mov, mp4, mpeg)
    - Metadaten?
  - xml-Volltexte ?
  - –> Priorisierung
    - laufende Produktion (Rara, Karten)
    - Volltexte (Format?, Anfrage bei KT)
    - retrospektiv 100 TB
    - Audio-Videodaten
    - Spezialsammlungen (Delisle, Herbarblätter)
- In welchen Formaten oder auf anderen Systemen (außerhalb DLC) liegen noch weitere Daten vor und sollen diese auch mit überführt werden?
- Welche Priorität haben die eigenen Daten selbst und speziell im Vergleich zum gesamten Vorhaben?
  - Rara und Karten haben oberste Priorität
- Wie sieht die (Wunsch-) Vorstellung zur Zeitplanung aus?
  - zuerst: Bearbeitung der Rara, Karten und Manuskripte in Goobi.Workflow und Anzeige in Goobi.Viewer
  - später: Audio/Videos, Volltexte und Spezialsammlungen (Adanson, Delisle)

b) Vorstellung von intrandas erster Bestandsaufnahme der Daten
- erste Einschätzungen
  - Metadaten für Rara und Karten: Handling originalschriftlicher Zeichen !
    - Übernahme aus GVK, Aufbereitung in Goobi.Workflow (MD Editor), Anzeige und Suche im Goobi.Viewer

c) Zusammenstellung von Erwartungen
Welche Erwartungen bestehen hinsichtlich des Projektablaufs?
- Massenimport von Binär- und Metadaten (Rara, Karten usw.)
- Generierung von Volltexten mittels OCR
- adäquate Anzeige und Suche in Goobi.Viewer
Welche Erwartungen bestehen neben der existierenden Funktionalität an die Software?
- Für MPIWG: Integration von Goobi-Workflow in die neue DRI (Repository)

dokuwiki

User Tools

Site Tools

Goobi-Workshop, 12.02.

Page Tools