User Tools

Site Tools


goobi_120219

Goobi-Workshop, 12.02.

  • Protokoll
    • TeilnehmerInnen
    • Moderation
    • Vorstellung
      • MPIB
      • MPIWG (s. unten)
      • KHI: TIf Einzelseiten, Inhaltsverzeichnisse, Druckwerke 17.-18. Jh. aber auch Handschriften (heraldische Schriften), Bedarf: Auszeichnung/Annotationen von Einzelelementen auf Bildern, Metadaten als linked-open Daten (Abbildung über IIIF), Funktion goobi.workflow: Crowdsourcing für Bildelemente; MD im BVB (ohne Inhaltsverzeichnisse), intensive bibliographische Erschließung Drucke 16. Jahrhunderrts, Münzbücher (Transkriptionen im TEI-Format → Übernahme aus MPIWG, Sprungmarken zu externen Ressourcen, Census); kodikologische Daten (Access-Datenbank, xml-Ausgabeformat): Ziel Integration in Goobi als Linked Data, mehrsprachige Suche (Feldnamen), Beschreibung der Inhalte auf Dt., 20-30 Felder gefüllt mit einem Vokabular (ca. 360 Begriffe); Integration der Vokabularien in Goobi: Vorgehensweise zweistufig; weitere Bento-Datenbank (Momento?) für Tablets, Ausgabe CSV/Excel-Format, Photomaterial, Untersuchung Restaurierung (nicht öffentlich) – für Phase 2
      • OCR: Einrichtung, Kosten pro Bild, Angebot für OCR
        • OCR-Engine: Tesseract; Generierung von ground-truth-Daten
      • Goobi.Viewer: Angebot für Unterstützung RTL, Blättern
      • Preis pro Seite
      • METS/MODS
        • aus Goobi.Workflow: vollständig, “aufheben”
        • aus Goobi.Viewer: konform, ggf. Auswahl
      • MPIWG
        • Anzeige im Kontext DLC
        • Integration
        • DRI
        • Konzentration auf Rara, Karten
        • Video, Audio, Herbarblätter später
      • Konfiguration
        • Goobi.Viewer: eine Instanz für alle Teilnehmer?
        • Goobi.Workflow: mehrfache INstanzen? Admin?
          • MPIWG → eigene Instanz?
          • Besprechung
        • MPIeR: Footer
        • PID-Management: Umstellung der Handles (Werkebene)
          • Weiterleitung
          • URLs
            • Berücksichtigung beim Datenimport
          • Granularität?
            • Empfehlung: pro Werk
          • DOI
        • Ausgabe der Lizenz, Rechteinformation
        • Automatische Vergabe von URNs, Handles?
          • Ansprechpartner für ePIC, API
      • MPIeR
        • verschiedene Digitalisierungsvorhaben, DFG-Projekte, Sammlungen: DLC, nicht-DLC, Archiv Vatikan; Priorität: 1. DLC, 2. restliche Sammlungen, außerhalb DLC; Produktion, wenn Migration abgeschlossen ist; Einspielen JPGs, Tiff ggf. später
    • Bestandsaufnahme Daten (Intranda)
      • Bsp. Linz (Panorama, Karten)
        • Tif, Größe
      • Kataloge
        • Mapping, Encoding muss überprüft werden
        • MPIWG
          • Überprüfung der originalschriftlichen Zeichen (Anzeige im Interface, Ausgabe in METS/MODS)
            • → Intranda: Mapping Felder, Publikationstypen
          • Plugin: Aktualisierung der Daten in Goobi aus Bibliothekskatalogen und anderen Quellen
          • kodikologische Daten: wie Normdatensätze? Aktualisierung? Integration in Goobi.workflow/.viewer
          • Pagebreak
  • Originalschriftliche Zeichen
    • Übernahme aus Katalog; Mapping kann individuell konfiguriert werden (seitens Intranda, GBV)
  • Frage: Migration von Identifiern (aus DLC, MPIWG?)
  • Integration Volltexte
    • TEI? ECHO-XML?
    • Rücksprache mit KT
  • Meilensteine, Prioritäten
    • Kosten?
    • Instanzen?
    • Hosting?
      • RS mit GWDG (Architektur)
    • Viewer?
      • Vorschlag Intranda (MPG-Layout)
      • Layout, pragmatisch
      • 2 Beispiele digitaler Bibliotheken
    • Bewertung der Datenbasis??
      • Facettierung?
      • individuell nach Einrichtung?
      • Beispiele!
    • Intranda, Nachfrage bei DOI
    • Spezifikation der Workflows
      • Aufsetzen durch Intranda für Import
      • Schulungen vor Ort
        • Regel 2 Tage, Anwendung, Projektmanagement, Administration
        • Spezifika
    • Angebot?
      • Finanzierung, Vertragsabschluss
    • Goobi.Viewer
      • Übersetzungen → Ital.
      • RTL-Unterstützung
      • Merklisten/Sammlungen
      • IIIF: Image, Presentation, Change Discovery API
        • Aufnahme Search API
      • Toolbar Helligkeit/Kontrast → im Mirador, Link
      • Zitierlink Bildausschnitte, Kontextbezogen
      • Bildähnlichkeitssuche?
      • Ergebnisanzeige: Images für Untertreffer
  • MPIWG: Vorab-Installation
    • Einbinung von Goobi.Workflow/.Viewer in die DRI
    • Verbindung Goobi - Repository
  • a) Vorstellung MPIWG
    • Welche Daten liegen insgesamt vor?
      • Einspeisung: laufend, retrospektiv (ca. 100 TB auf Bandarchiv im GNZ)
      • überwiegend Bilddateien von Rara, Karten, Manuskripten, Herbarien (Formate: tif)
        • Master: Tif-Einzelseiten
        • im allgemeinen: kein OCR
        • Rohformate: DNG?
        • Metadaten
          • für Rara, Karten und Manuskripte im GVK
          • für Spezialsammlungen (Delisle-Korrespondenz und Adanson-Herbarblätter) in Excel-Tabellen
          • Besonderheit: Berücksichtigung originalschriftlicher Angaben (Chinesisch usw.) bei der Datenübernahme aus dem GVK, beim Retrieval in Goobi.Viewer usw.
      • Audiodateien (Formate: aiff, mp3, wav)
        • Metadaten?
      • Videodaten (Formate: mov, mp4, mpeg)
        • Metadaten?
      • xml-Volltexte ?
      • –> Priorisierung
        • laufende Produktion (Rara, Karten)
        • Volltexte (Format?, Anfrage bei KT)
        • retrospektiv 100 TB
        • Audio-Videodaten
        • Spezialsammlungen (Delisle, Herbarblätter)
    • In welchen Formaten oder auf anderen Systemen (außerhalb DLC) liegen noch weitere Daten vor und sollen diese auch mit überführt werden?
    • Welche Priorität haben die eigenen Daten selbst und speziell im Vergleich zum gesamten Vorhaben?
      • Rara und Karten haben oberste Priorität
    • Wie sieht die (Wunsch-) Vorstellung zur Zeitplanung aus?
      • zuerst: Bearbeitung der Rara, Karten und Manuskripte in Goobi.Workflow und Anzeige in Goobi.Viewer
      • später: Audio/Videos, Volltexte und Spezialsammlungen (Adanson, Delisle)
  • b) Vorstellung von intrandas erster Bestandsaufnahme der Daten
    • erste Einschätzungen
      • Metadaten für Rara und Karten: Handling originalschriftlicher Zeichen !
        • Übernahme aus GVK, Aufbereitung in Goobi.Workflow (MD Editor), Anzeige und Suche im Goobi.Viewer
  • c) Zusammenstellung von Erwartungen
  • Welche Erwartungen bestehen hinsichtlich des Projektablaufs?
    • Massenimport von Binär- und Metadaten (Rara, Karten usw.)
    • Generierung von Volltexten mittels OCR
    • adäquate Anzeige und Suche in Goobi.Viewer
  • Welche Erwartungen bestehen neben der existierenden Funktionalität an die Software?
    • Für MPIWG: Integration von Goobi-Workflow in die neue DRI (Repository)
goobi_120219.txt · Last modified: 2020/10/10 14:13 by 127.0.0.1