====== Digital Library ====== ===== Vision ===== * **Zielgruppe** * Focus MPIWG * "Außenwelt" (Öffnungsprozess, Ausweis des Instituts)? * **Digitale Faksimiles von Objekten jeglicher Art** * hohe Qualität ("digitale Faksimiles") * optimale Reproduzierbarkeit * für Verlagspublikationen -> Edition Open Access * für MPIWG-Website -> Streaming eines Interviews * flexible Einbindung von Inhalten in andere/neue, zukünftige Repositorien * Was sind "Artefakte" (Abt. III)? * **Volltexte** * automatisiert/OCR * halbautomatisiert (s. [[https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-content/wiki|"xml-Workflow"]], abhängig von der Quelle) * **Standards** * Einhaltung (zumindest Kompatibilität) bei der Produktion (Digitalisierung), Aufbereitung (z.B. Erfassung von Metadaten und Volltexten) sowie Präsentation von Digitalisaten (Design; Schnittstellen für Benutzer, Bibliothekssysteme, externe Repositorien -> Sichtbarkeit, Nachnutzbarkeit, Nachhaltigkeit!; standardisierte Nutzerrechte -> Creative Commons Lizenzen etc.) * Beobachtung von Entwicklungen, Trends * **Arbeitsintrument**, Tool ("Digital Libraries gibt es genug") * Nähe zur Forschung (Individuum, Projekt)! * Personalisierter Arbeitsbereich, Workspace * Annotationen, Tagging * Teilen von Informationen * Sollten Wissenschaftler selbständig Inhalte hochladen können? (ursprüngliches Ziel des [[https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-content/wiki|"xml Worfklows"]]) * **"Back-end System"** * Unterstützung der Workflows für Digitalisierung, Datenarchivierung, Metadaten-Management etc. * Kommunikationsmodul (Blog, Ticket-System o.ä.) * Dokumentation von Workflows (auch gegenwärtig: Edition Open Access!) * **Lokalisierung im MPIWG** * Projekt der Bibliothek * Loslösung von den Partikularinteressen und divergierenden Bestrebungen der Forschungsabteilungen? * Schnittstellen zu laufenden und zukünftigen Forschungsprojekten im Institut * IT-Infrastrukturabteilung nicht vorhanden, oder doch? * Wie sich verhalten? Antworten finden, -> **Notwendigkeit einer Strategie (Policy)**! * **Kommunikation** * Relativ offen auch für MPIWG + Außenwelt * schrittweise Bereitstellung (Beta-Versionen) * Partizipation (Feedback) ermöglichen! * **Personal** * Digigroup * Änderung des bisherigen Konzepts "Digigroup" * veränderte Rahmenbedingungen * weniger Rara * SHKs veränderte Studienbedingungen u.a. * Dienstleister für das gesamte Institut (Bibliothek, Forschungsabteilungen) * Transfer von Know-How * Management * "Produktionsmanager" * fundierte Kenntnisse Hard-/Software * Beobachtung neuer Entwicklungen * Flexibilität gegenüber neuen Anfordungen * Wie realistisch ist das ganze? ===== Situation MPIWG ====== ==== Bibliothek: Woher kommen Digitalisate? ==== * **Bestellungen im Rahmen von "Inter Library Loan"** * Diverse Formate (pdf, jpg, tif) * Bsp.: Digitalisate einer arabischen Handschrift aus der Univ. Cambridge (s/w Tiff), Zeitschriftenaufsatz über Subito-Lieferdienst (pdf) * in der Regel kein Recht auf Veröffentlichung im Netz (Inter-/Intranet) * Metadaten: Bestelldatensatz in Biblio * Digitalisate gehen direkt an die Besteller (Email, FTP, DVD etc.) * Ausnahme: einzelne PDFs werden für den Zugriff im Intranet auf dem www2-Server abgelegt * **Bestellung im Rahmen von "Copyright Clearance"** * Beschaffung von Abbildungen plus Einholen der Rechte beispielsweise für eine Verlagsveröffentlichung * Diverse Formate (tif, jpg) * Digitalisate gehen direkt an die Besteller (einzelne Wissenschaftler, Projekte) * **Gezielte Akquise von Digitalisaten** * HQ Scans * Metadaten vorhanden: Bibliothekskatalog, index.meta * mit Recht auf Präsentation im Internet ("CC-BY-SA" ?) * Rara * Beschaffung digitaler Faksimiles z.B. aus der SUB Göttingen, BNF (Guidobaldo), British Library * Im Rahmen wissenschaftlicher Kooperationen * [[http://echo.mpiwg-berlin.mpg.de/content/chineseknowledge/ihns|Chinese Academy of Sciences]] * [[http://echo.mpiwg-berlin.mpg.de/content/buddhism/mongol|Mongolica]] * Manuskripte * Korrespondenzen (Delisle) * Weitere Sonderbestände * Herbariensammlungen (Humboldt, Adanson) * **Eigenproduktion (Digitalisierung durch die Digigroup)** * **Erstellung digitaler Faksimiles von wertvollen Beständen** * **Rara** * HQ Scans * Volltexte für ausgewählte Werke vorhanden (-> xml-Workflow) * Bsp.: [[http://echo.mpiwg-berlin.mpg.de/MPIWG:2DVTZFB4|Benedetti 1585]] * Veröffentlichung unter "CC-BY-SA"-Lizenz * Metadaten: Bibliothekskatalog, index.meta, zusätzlich in: * [[https://www.deutsche-digitale-bibliothek.de/searchresults?query=provider%3A%28max\-planck\-institut+OR+f%C3%BCr+OR+wissenschaftsgeschichte%29&offset=0&rows=20&facetValues[]=provider_fct%3DMax-Planck-Institut+f%C3%BCr+Wissenschaftsgeschichte|Deutsche Digitale Bibliothek]] * Europeana * Metadaten dublett * unter Provider [[http://www.europeana.eu/portal/search.html?query=DATA_PROVIDER%3A%22Max-Planck-Institut+f%C3%BCr+Wissenschaftsgeschichte%22&qf=PROVIDER%3A%22DM2E%22|"DM2E -> Max-Planck-Institut für Wissenschaftsgeschichte"]]: 1288 Treffer * unter Provider [[http://www.europeana.eu/portal/search.html?query=DATA_PROVIDER%3A%22Max-Planck-Institut+f%C3%BCr+Wissenschaftsgeschichte+%28Max+Planck+Institute+for+the+History+of+Science%29%22&qf=PROVIDER%3A%22Deutsche+Digitale+Bibliothek%22|"Deutsche Digitale Bibliothek -> Max-Planck-Institut für Wissenschaftsgeschichte (Max Planck Institute for the History of Science)"]]: 1334 Treffer * [[http://www.europeana.eu/portal/europeana-providers.html|Europeana Providers]] * **Archivalien** * HQ Scans * Metadaten: Archivalien, index.meta * Digitalisierte Briefwechsel (Emil Rupp, Albert/Elsa Einstein) * Kein Recht auf Veröffentlichung im Internet aber interne Bereitstellung (legal?) * [[http://echo.mpiwg-berlin.mpg.de/content/modernphysics/gehrcke/newspaper_articles/gehrcke_folders|Gehrcke Zeitungsausschnittsammlung]] zu Albert Einstein * Veröffentlichung unter "CC-BY-SA"-Lizenz (legal?) * **Weitere Sonderbestände (meist projektbezogen)** * HQ Scans * Metadaten: teilweise Bibliothekskatalog, teilweise projekteigene (FMP-)Datenbanken, index.meta * Digitalisierung der Sammlung AHQP (Mikrofilme) für das Projekt [[http://quantum-history.mpiwg-berlin.mpg.de/main|Quantum History]] * Kein Recht auf Veröffentlichung im Internet aber interne Bereitstellung (legal?) * Digitalisierung von Akten aus dem MPG-Archiv für das [[https://www.mpiwg-berlin.mpg.de/en/research/projects/DEPT1_458_HistMPS|GMPG-Projekt]] * Zugriff nur für sehr eingeschränkten Benutzerkreis (Mitglieder des GMPG-Projets) * Digitalisierung arabischer Handschriften aus der Staatsbibliothek PK Berlin für das [[https://ismi.mpiwg-berlin.mpg.de/drupal-ismi/|ISMI-Projekt]] * Teilweise freie Präsentation im Netz ("Go" der Staatsbibliothek) * Digitalisierung der Zeitschrift "Hoppe-Seyler" von Mikrofilm für das [[http://vlp.mpiwg-berlin.mpg.de/index_html|The Virtual Laboratory]] * Veröffentlichung im Internet (legal?) * **Digitalisierungskampagnen außerhalb des MPIWG** * vornehmlich Handschriften und Rara * HQ Scans * Metadaten: Bibliothekskatalog, index.meta * Veröffentlichung unter "CC-BY-SA"-Lizenz * [[http://echo.mpiwg-berlin.mpg.de/home/search?searchSimple=harriot|Harriot]] (Petworth), plus eingekaufte Digitalisate aus der British Library * [[http://echo.mpiwg-berlin.mpg.de/content/mpiwglib/pesaro|Guidobaldo del Monte]] (Pesaro) * [[http://echo.mpiwg-berlin.mpg.de/content/mpiwglib/stresa|Bernardino Baldi]] (Stresa) * [[http://echo.mpiwg-berlin.mpg.de/content/florentinecathedral/oechslin|Vitruv-Ausgaben]] (Einsiedeln) * **Einzelaufträge** * Digitalisierung "on demand" für einzelne Nutzer, Projekte im Institut * Vollständige Bücher, einzelne Abbildungen * HQ Scans * Digitalisate gehen an den Auftraggeber * **Mediathek ?** ==== Bibliothek: Präsentation von Digitalisaten ==== * **Suche** * [[http://www.mpiwg-berlin.mpg.de/en/resources|Einstieg MPIWG Homepage/Sources]] * Auswertung der index.meta-Files (Solr Index) * nicht aktuell (obsolet), Stand Raradigitalisierung: Mitte Mai 2015 * [[http://echo.mpiwg-berlin.mpg.de/content/search|ECHO Search]] * basiert auf CMS Zope * sehr unvollständig * Einträge können nur manuell erstellt werden * [[http://141.14.236.36/fmi/xsl/katalog/findrecords.xsl?-db=katalog&-grammar=fmresultset&-view=|Bibliothekskatalog]] * up-to-date - zumindest was die Eigenproduktion der Bibliothek angeht * **Anzeige** * **ECHOdocuViewer** () * Anzeige von Bildern (jpg) teilweise mit Volltexten * Bsp. Benedetti 1585 (Bilder+Volltext) * http://echo.mpiwg-berlin.mpg.de/MPIWG:2DVTZFB4 * http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?url=/permanent/library/163127KK/index.meta * **digilib** * umfangreiche Funktionalität (bspw. Setzen von Markern) * **Libcoll Viewer** () * Anzeige von Bilder und Volltexten plus **"Annotator"** * Bsp. * http://libcoll.mpiwg-berlin.mpg.de/MPIWG:9M64RMWA * http://libcoll.mpiwg-berlin.mpg.de/libviewa?url=/permanent/library/MAY9T8KY/index.meta * Ältere DocuViewer-Varianten * http://nausikaa2.rz-berlin.mpg.de/digitallibrary/digilib.jsp?fn=permanent/einstein/cw/009_B_1925/pageimg/&pn=2 * Permanent IDs * [[https://it-dev.mpiwg-berlin.mpg.de/tracs/metadataprovider/wiki/purls|Wikieintrag: Struktur permanenter URL und Identifier des Institutes]] * **Desiderata** * zentraler Einstiegspunkt für die Recherche (Search, Browse) * (generelles) Annotationstool * (XML-)Editor für die Korrektur von index.metas, zum Kommentieren * Ausgabemöglichkeiten (Download, Print) * PDF (ausgewählte Seiten, komplettes Werk, OCR?) * hochauflösende Images (Tiff) zumindest partiell * Oberfläche * Responsive Design: Optimierung auch für Tablets, Smartphones etc. * Anzeige und Inhalt der Metadaten (Copyrighthinweis etc.) * Permanent IDs * nur für das Gesamtwerk * Kapitel, Seiten? * Angabe einer zitierfähigen URL * funktioniert nur für images ("pageimg") * Was ist mit .pdf, Videofiles (Mediathek) etc.? * Suche * Integration von Volltexten und OCR * Bsp. * [[https://www.bsb-muenchen.de/literatursuche/alle-fachgebiete-kataloge-und-datenbanken/opacplus/opacplus-volltexte-beta/|BSB Opacplus Volltexte beta]] * Zitierfähigkeit * Permanente IDs (Links) * klar formulierte Nutzungsbedingungen (CC-Lizenzen) ==== Links ==== * Ressourcen * [[http://www.mpiwg-berlin.mpg.de/en/resources|Sources, Research Websites]] * [[http://echo.mpiwg-berlin.mpg.de/content|ECHO Content]] * [[http://mediathek.mpiwg-berlin.mpg.de/mediathekPublic/index.html|Mediathek]] * Index.meta-Standard * [[http://intern.mpiwg-berlin.mpg.de/digitalhumanities/mpiwg-metadata-documentation/formate/indexmeta-standard/|Homepage]] * [[http://intern.mpiwg-berlin.mpg.de/digitalhumanities/mpiwg-metadata-documentation/formate/indexmeta-standard/additional-metadata|Metadata elements]] * [[digital_library_index_meta|Beispiel]] * MPDL-MPIWG Project * [[http://mpdl.mpiwg-berlin.mpg.de/|Homepage]] * [[http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/query.xql|Repository browser]] * [[https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-content/wiki|Wiki]] * [[https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-content/wiki/OverviewWorkOrders|Overview of digitized texts (Trac)]] * ECHO * [[https://it-dev.mpiwg-berlin.mpg.de/tracs/echo|ECHO Trac]] * Wikis * [[http://itgroup.mpiwg-berlin.mpg.de/dokuwiki/doku.php?id=projects:overview|IT-Projekte]] (Stand 2008) * Kein (umfassender) Überblick über die aktuellen IT-Entwicklungen im MPIWG! ==== Feedback ==== * Dirk Wintergrün -> Indexierung (Solr-Index, OCR), "digital humanities" * Klaus Thoden -> [[https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-content/wiki|"xml-Workflow"]] * Robert Casties -> Viewer-Entwicklung * Shih-Pei -> Bestrebungen von Abt. III ===== Außenwelt ===== * Lösungen * [[http://www.goobi.org/|Goobi]] * Standards * Metadaten * [[https://en.wikipedia.org/wiki/METS|METS (Metadata Encoding and Transmission Standard)]] * [[https://en.wikipedia.org/wiki/Metadata_Object_Description_Schema|MODS (Metadata Object Description Schema)]] * Volltexte * [[http://www.tei-c.org/index.xml|TEI]] * Wie sind "Informations-Infrastrukturmaßnahmen" einzuschätzen? * textgrid, Dariah, Clarin ...