Table of Contents
Digital Library
Vision
Situation MPIWG
Bibliothek: Woher kommen Digitalisate?
Bibliothek: Präsentation von Digitalisaten
Links
Feedback
Außenwelt
Digital Library
Vision
Zielgruppe
Focus MPIWG
“Außenwelt” (Öffnungsprozess, Ausweis des Instituts)?
Digitale Faksimiles von Objekten jeglicher Art
hohe Qualität (“digitale Faksimiles”)
optimale Reproduzierbarkeit
für Verlagspublikationen → Edition Open Access
für MPIWG-Website → Streaming eines Interviews
flexible Einbindung von Inhalten in andere/neue, zukünftige Repositorien
Was sind “Artefakte” (Abt. III)?
Volltexte
automatisiert/OCR
halbautomatisiert (s.
"xml-Workflow"
, abhängig von der Quelle)
Standards
Einhaltung (zumindest Kompatibilität) bei der Produktion (Digitalisierung), Aufbereitung (z.B. Erfassung von Metadaten und Volltexten) sowie Präsentation von Digitalisaten (Design; Schnittstellen für Benutzer, Bibliothekssysteme, externe Repositorien → Sichtbarkeit, Nachnutzbarkeit, Nachhaltigkeit!; standardisierte Nutzerrechte → Creative Commons Lizenzen etc.)
Beobachtung von Entwicklungen, Trends
Arbeitsintrument
, Tool (“Digital Libraries gibt es genug”)
Nähe zur Forschung (Individuum, Projekt)!
Personalisierter Arbeitsbereich, Workspace
Annotationen, Tagging
Teilen von Informationen
Sollten Wissenschaftler selbständig Inhalte hochladen können? (ursprüngliches Ziel des
"xml Worfklows"
)
“Back-end System”
Unterstützung der Workflows für Digitalisierung, Datenarchivierung, Metadaten-Management etc.
Kommunikationsmodul (Blog, Ticket-System o.ä.)
Dokumentation von Workflows (auch gegenwärtig: Edition Open Access!)
Lokalisierung im MPIWG
Projekt der Bibliothek
Loslösung von den Partikularinteressen und divergierenden Bestrebungen der Forschungsabteilungen?
Schnittstellen zu laufenden und zukünftigen Forschungsprojekten im Institut
IT-Infrastrukturabteilung nicht vorhanden, oder doch?
Wie sich verhalten? Antworten finden, →
Notwendigkeit einer Strategie (Policy)
!
Kommunikation
Relativ offen auch für MPIWG + Außenwelt
schrittweise Bereitstellung (Beta-Versionen)
Partizipation (Feedback) ermöglichen!
Personal
Digigroup
Änderung des bisherigen Konzepts “Digigroup”
veränderte Rahmenbedingungen
weniger Rara
SHKs veränderte Studienbedingungen u.a.
Dienstleister für das gesamte Institut (Bibliothek, Forschungsabteilungen)
Transfer von Know-How
Management
“Produktionsmanager”
fundierte Kenntnisse Hard-/Software
Beobachtung neuer Entwicklungen
Flexibilität gegenüber neuen Anfordungen
Wie realistisch ist das ganze?
Situation MPIWG
Bibliothek: Woher kommen Digitalisate?
Bestellungen im Rahmen von “Inter Library Loan”
Diverse Formate (pdf, jpg, tif)
Bsp.: Digitalisate einer arabischen Handschrift aus der Univ. Cambridge (s/w Tiff), Zeitschriftenaufsatz über Subito-Lieferdienst (pdf)
in der Regel kein Recht auf Veröffentlichung im Netz (Inter-/Intranet)
Metadaten: Bestelldatensatz in Biblio
Digitalisate gehen direkt an die Besteller (Email,
FTP
, DVD etc.)
Ausnahme: einzelne PDFs werden für den Zugriff im Intranet auf dem www2-Server abgelegt
Bestellung im Rahmen von “Copyright Clearance”
Beschaffung von Abbildungen plus Einholen der Rechte beispielsweise für eine Verlagsveröffentlichung
Diverse Formate (tif, jpg)
Digitalisate gehen direkt an die Besteller (einzelne Wissenschaftler, Projekte)
Gezielte Akquise von Digitalisaten
HQ Scans
Metadaten vorhanden: Bibliothekskatalog, index.meta
mit Recht auf Präsentation im Internet (“CC-BY-SA” ?)
Rara
Beschaffung digitaler Faksimiles z.B. aus der SUB Göttingen, BNF (Guidobaldo), British Library
Im Rahmen wissenschaftlicher Kooperationen
Chinese Academy of Sciences
Mongolica
Manuskripte
Korrespondenzen (Delisle)
Weitere Sonderbestände
Herbariensammlungen (Humboldt, Adanson)
Eigenproduktion (Digitalisierung durch die Digigroup)
Erstellung digitaler Faksimiles von wertvollen Beständen
Rara
HQ Scans
Volltexte für ausgewählte Werke vorhanden (→ xml-Workflow)
Bsp.:
Benedetti 1585
Veröffentlichung unter “CC-BY-SA”-Lizenz
Metadaten: Bibliothekskatalog, index.meta, zusätzlich in:
Deutsche Digitale Bibliothek
Europeana
Metadaten dublett
unter Provider
"DM2E -> Max-Planck-Institut für Wissenschaftsgeschichte"
: 1288 Treffer
unter Provider
"Deutsche Digitale Bibliothek -> Max-Planck-Institut für Wissenschaftsgeschichte (Max Planck Institute for the History of Science)"
: 1334 Treffer
Europeana Providers
Archivalien
HQ Scans
Metadaten: Archivalien, index.meta
Digitalisierte Briefwechsel (Emil Rupp, Albert/Elsa Einstein)
Kein Recht auf Veröffentlichung im Internet aber interne Bereitstellung (legal?)
Gehrcke Zeitungsausschnittsammlung
zu Albert Einstein
Veröffentlichung unter “CC-BY-SA”-Lizenz (legal?)
Weitere Sonderbestände (meist projektbezogen)
HQ Scans
Metadaten: teilweise Bibliothekskatalog, teilweise projekteigene (FMP-)Datenbanken, index.meta
Digitalisierung der Sammlung AHQP (Mikrofilme) für das Projekt
Quantum History
Kein Recht auf Veröffentlichung im Internet aber interne Bereitstellung (legal?)
Digitalisierung von Akten aus dem MPG-Archiv für das
GMPG-Projekt
Zugriff nur für sehr eingeschränkten Benutzerkreis (Mitglieder des GMPG-Projets)
Digitalisierung arabischer Handschriften aus der Staatsbibliothek PK Berlin für das
ISMI-Projekt
Teilweise freie Präsentation im Netz (“Go” der Staatsbibliothek)
Digitalisierung der Zeitschrift “Hoppe-Seyler” von Mikrofilm für das
The Virtual Laboratory
Veröffentlichung im Internet (legal?)
Digitalisierungskampagnen außerhalb des MPIWG
vornehmlich Handschriften und Rara
HQ Scans
Metadaten: Bibliothekskatalog, index.meta
Veröffentlichung unter “CC-BY-SA”-Lizenz
Harriot
(Petworth), plus eingekaufte Digitalisate aus der British Library
Guidobaldo del Monte
(Pesaro)
Bernardino Baldi
(Stresa)
Vitruv-Ausgaben
(Einsiedeln)
Einzelaufträge
Digitalisierung “on demand” für einzelne Nutzer, Projekte im Institut
Vollständige Bücher, einzelne Abbildungen
HQ Scans
Digitalisate gehen an den Auftraggeber
Mediathek ?
Bibliothek: Präsentation von Digitalisaten
Suche
Einstieg MPIWG Homepage/Sources
Auswertung der index.meta-Files (Solr Index)
nicht aktuell (obsolet), Stand Raradigitalisierung: Mitte Mai 2015
ECHO Search
basiert auf
CMS
Zope
sehr unvollständig
Einträge können nur manuell erstellt werden
Bibliothekskatalog
up-to-date - zumindest was die Eigenproduktion der Bibliothek angeht
Anzeige
ECHOdocuViewer
(<access type=“free”>)
Anzeige von Bildern (jpg) teilweise mit Volltexten
Bsp. Benedetti 1585 (Bilder+Volltext)
http://echo.mpiwg-berlin.mpg.de/MPIWG:2DVTZFB4
http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?url=/permanent/library/163127KK/index.meta
digilib
umfangreiche Funktionalität (bspw. Setzen von Markern)
Libcoll Viewer
(<access type=“institution”>)
Anzeige von Bilder und Volltexten plus
“Annotator”
Bsp.
http://libcoll.mpiwg-berlin.mpg.de/MPIWG:9M64RMWA
http://libcoll.mpiwg-berlin.mpg.de/libviewa?url=/permanent/library/MAY9T8KY/index.meta
Ältere DocuViewer-Varianten
http://nausikaa2.rz-berlin.mpg.de/digitallibrary/digilib.jsp?fn=permanent/einstein/cw/009_B_1925/pageimg/&pn=2
Permanent IDs
Wikieintrag: Struktur permanenter URL und Identifier des Institutes
Desiderata
zentraler Einstiegspunkt für die Recherche (Search, Browse)
(generelles) Annotationstool
(XML-)Editor für die Korrektur von index.metas, zum Kommentieren
Ausgabemöglichkeiten (Download, Print)
PDF (ausgewählte Seiten, komplettes Werk, OCR?)
hochauflösende Images (Tiff) zumindest partiell
Oberfläche
Responsive Design: Optimierung auch für Tablets, Smartphones etc.
Anzeige und Inhalt der Metadaten (Copyrighthinweis etc.)
Permanent IDs
nur für das Gesamtwerk
Kapitel, Seiten?
Angabe einer zitierfähigen
URL
funktioniert nur für images (“<texttool><image>pageimg</image></texttool>”)
Was ist mit .pdf, Videofiles (Mediathek) etc.?
Suche
Integration von Volltexten und OCR
Bsp.
BSB Opacplus Volltexte beta
Zitierfähigkeit
Permanente IDs (Links)
klar formulierte Nutzungsbedingungen (CC-Lizenzen)
Links
Ressourcen
Sources, Research Websites
ECHO Content
Mediathek
Index.meta-Standard
Homepage
Metadata elements
Beispiel
MPDL-MPIWG Project
Homepage
Repository browser
Wiki
Overview of digitized texts (Trac)
ECHO
ECHO Trac
Wikis
IT-Projekte
(Stand 2008)
Kein (umfassender) Überblick über die aktuellen IT-Entwicklungen im MPIWG!
Feedback
Dirk Wintergrün → Indexierung (Solr-Index, OCR), “digital humanities”
Klaus Thoden →
"xml-Workflow"
Robert Casties → Viewer-Entwicklung
Shih-Pei → Bestrebungen von Abt. III
Außenwelt
Lösungen
Goobi
Standards
Metadaten
METS (Metadata Encoding and Transmission Standard)
MODS (Metadata Object Description Schema)
Volltexte
TEI
Wie sind “Informations-Infrastrukturmaßnahmen” einzuschätzen?
textgrid, Dariah, Clarin …