Brown Bag Lunch - Topic: "Personal Digital Libraries (PDL)"

, 3:00 pm to

The Brown Bag Lunch is an informal meeting to exchange ideas and news on Digital Humanities and the opportunity to meet other researchers from the Campus labs. It will take place as usual in the Seminar room of the Heyne Haus.

This time Jörg Wettlaufer will present on: "Brauchen wir eine persönliche digitale Bibliothek (PDL) für unsere wissenschaftliche Arbeit? Überlegungen zu einem bislang fehlenden Arbeitsinstrument in der Digitalen Transformation."

Abstract: Der Beitrag möchte für die Digitalen Geisteswissenschaften und insbesondere die digitalen Geschichtswissenschaften ein frei verfügbares Arbeitsinstrument diskutieren, das folgende Voraussetzungen erfüllt:
 
•    Open Source Modell mit Nachhaltigkeitskonzept
•    Ununterbrochener Digitaler Workflow, der vom PDF Dokument ausgeht
•    Unterstützung bei der Sichtung, Sortierung, Kollationierung und Referenzierung von Informationen durch Technologien des Machine Learning bzw. Deep Learning
•    Möglichst geringer Korrekturaufwand im Bereich der Referenz- und Metadaten
•    Möglichkeit zur Kollaboration, aber kein Zwang zur Zusammenarbeit
•    Automatische Verlinkung der extrahierten Referenzen in digitale Online Bibliotheken (Open Access oder auch google books)
 
Workflow_DG_0_4.png
Abb.: Schematische Darstellung des Workflow in den digitalisierten Geisteswissenschaften bis zu einem Frontend mit persönlicher digitaler Bibliothek.

Ein solches, den digitalen Workflow der überwiegenden Zahl der HistorikerInnen unterstützendes Arbeitswerkzeug, existiert bislang nicht. Ansätze hierzu sind allerdings schon seit einigen Jahren vorhanden, ohne bislang eine Marktreife erlangt zu haben. Zunächst ist hier GROBID als Webservice und Baisistechnologie für verschiedene Projekte zu nennen, der die Extraktion von Metadaten und Referenzen aus PDF-Texten unterstützt (Lopez / Romary 2017).  Ein Produkt für den Comsumer Markt ist Mendeley, das nach dem Kauf durch Elsevier als praktisch nicht mehr nutzbar angesehen wird und zudem ein kollaboratives Konzept verfolgt, das schnell an die Grenzen des Urheberrechts stößt.  Weitere Tools decken Teilaspekte es Workflows ab, ohne jedoch die entscheidenden Brüche überbrücken zu können (vgl. Dippel 2016).
In der digitalen Geschichtswissenschaft des 21. Jahrhunderts sollten Angebote zur Bewältigung der Informationsmenge bereitgestellt werden, die es den ForscherInnen erlauben, sich auf ihre Kernarbeit, die Einordnung der Fakten in größere Zusammenhänge und ihre Gewichtung zu konzentrieren – eine Arbeit, die in absehbarer Zeit kaum sinnvoll maschinell zu leisten ist. Der kritische Anspruch der Geisteswissenschaften kann nur aufrecht erhalten werden, wenn sich die Arbeit der ForscherInnen und Forscher nicht im Kampf mit Tools in Informationsfluten verliert, sondern auf robuste und fachlich etablierte Workflows zurückgreifen kann. Dabei sollte die mit Hilfe der künstlichen Intelligenz erzielte Vorverarbeitung und Aufbereitung jederzeit transparent und kritisch hinterfragbar sein.