}

9:00 – 10:45

Fachhochschule Potsdam

Campus Kiepenheuerallee,
diverse, s. Workshops

Workshops 2a

10: Vom Begriff über das Phänomen zur Analyse – ein CRETA-Workshop zur Operationalisierung in den DH | Melanie Andresen*, Benjamin Krautter*, Janis Pagel*, Axel Pichler*

Melanie Andresen, Benjamin Krautter, Janis Pagel, Axel Pichler | Raum: 2/014

Der Workshop stellt eine weiterentwickelte und personell anders besetzte Version eines auf der DHd 2020 abgehaltenen Workshops dar. Er adressiert mit dem Konzept und der Praxis der Operationalisierung eine der zentralen Herausforderungen für Arbeiten in den DH. Während Geisteswissenschaftler*innen vor allem mit komplexen, häufig mehrere Textphänomene umfassenden Konzepten arbeiten, ist die computergestützte Arbeit an identifizierbare Phänomene auf der Textoberfläche gebunden. Die hieraus erwachsende Diskrepanz zwischen theoretischen Erwartungen und konkreten Ergebnissen gilt es über eine adäquate Operationalisierung, also die Erkennung und Messbarmachung theoretischer Konzepte, zu überbrücken. Der Workshop will diese Schnittstelle in den Fokus rücken. Anhand ausgewählter Anwendungsfälle soll gezeigt werden, welche Herausforderungen sich aus dem Einsatz computergestützter Methoden für geisteswissenschaftliche Fragestellungen ergeben und wie mit ihnen umgegangen werden kann. In einem praktischen Teil haben die Teilnehmenden die Möglichkeit, an der Operationalisierung vorgegebener exemplarischer Fragestellungen der Textanalyse und der für sie relevanten Konzepte zu arbeiten.

11: Annotorious - eine JavaScript-Bibliothek für die Entwicklung maßgeschneiderter Bildannotationstools | Simon Rainer*, Erik Radisch*

Simon Rainer, Erik Radisch | Raum: 3/001

Annotorious ist eine JavaScript-Bibliothek, mit deren Hilfe es möglich ist, mit wenig Aufwand eine Bildannotationsumgebung zu programmieren. Trotz seiner Einfachheit ist sehr flexibel und bietet viele Möglichkeiten zur Anpassung und Erweiterung, wodurch es gerade für geisteswissenschaftliche Forschungsprojekte interessant ist, wo die Anforderungen an Annotationswerkzeuge stark variieren.

Ziel des Workshops ist es, den Teilnehmern umfassenden Einblick in den Funktionsumfang und in die Einsatzmöglichkeiten von Annotorious zu geben, und sie in die Lage zu versetzen, selbstständig Annotationsumgebungen zu erstellen, sie gemäß den eigenen Forschungsbedürfnissen individuell anzupassen, und über Plugins zu erweitern. Im Rahmen von praktischen Übungen werden die Teilnehmer dazu Basisszenarios auf dem eigenen Notebook entwickeln und Grundkomponenten (visuelles Erscheinungsbild, Annotations-Editor) anpassen.

12: Workshop: Repräsentativität in digitalen Archiven | Corinna Dziudzia*, Mark Hall*

Corinna Dziudzia, Mark Hall | Raum: 3/006

Die „Kulturen des digitalen Gedächtnisses“ operieren vor dem Hintergrund eines Spannungsfelds, das man auf eine Dichotomie von Kanon und Archiv zuspitzen kann. Die Komplexität in dieser Frage ergibt sich nicht zuletzt daraus, dass die Interessen und Anforderungen einer Reihe von Akteuren zusammentreffen: Geisteswissenschaftler_innen, Archivar_innen, Geldgeber_innnen und Informatiker_innen. Jede dieser Gruppen hat unterschiedliche Sichtweisen darauf, was Repräsentativität für sie bedeutet, aber was fehlt, ist ein Forum, in dem ein kontinuierlicher Austausch über diese Fragen über die Gruppengrenzen hinweg möglich ist. Der hier vorgeschlagene ganztägige Workshop für die DHd 2022 stellt einen ersten Schritt in diese Richtung dar, mit zwei geplanten Outputs: einem Positionspapier und der Gründung einer DHd-Arbeitsgruppe “Repräsentativität”. Es bestehen zwar schon akteursspezifische AGs (Datenzentren, DH Theory, OCR), die AG “Repräsentativität” wird aber Akteur_innen über Gruppengrenzen hinweg zusammenbringen, was unsere Vorarbeit als notwendig identifiziert hat.

13: GitMA oder CATMA für Fortgeschrittene – Projektdaten via Git abrufen und mittels Python-Bibliothek weiterverarbeiten | Mareike Schumacher*, Michael Vauth*, Dominik Gerstorfer*, Malte Meister*

Mareike Schumacher, Michael Vauth, Dominik Gerstorfer, Malte Meister | Raum: 3/008

Dieser CATMA-6-Workshop richtet sich an fortgeschrittene CATMA User*innen mit Vorkenntnissen in digitaler Annotation, die im Rahmen der eigenen Arbeit oder von Forschungsprojekten mit größeren Mengen von Annotationsdaten operieren (wollen). Im Zentrum steht die Weiterverarbeitung und Analyse von Annotationsdaten. Wie greife ich über Git auf meine CATMA-Annotationsdaten zu? Wie erstelle ich individuelle, interaktive Visualisierungen meiner Annotationsdaten? Wie berechne ich die Übereinstimmung zwischen mehreren Annotator*innen? Diese und ähnliche Fragen werden während des Workshops beantwortet.

14: Textexplorationen in der digitalen Literaturwissenschaft: eine kritische und angewandte Auseinandersetzung mit Repräsentations- und Interpretationsansätzen von Text | Stephanie Brandl*, David Lassner*, Cora Krömer*, Anne Baillot*

Stephanie Brandl, David Lassner, Cora Krömer, Anne Baillot | Raum: 3/012

In dem Workshop möchten wir uns der Thematik des Lesens und der vektoriellen Textrepräsentation von zwei Seiten nähern, wir geben (1) einen Überblick über die traditionellen Theorien des Lesens und kontextualisieren sie mit Erkenntnissen aus neurowissenschaftlichen Laborstudien. Wir geben (2) eine Zusammenfassung der aktuellen Methoden zu Textrepräsentation [z.B. Glove, Bert] und Beispiele für DH-Projekte, in denen diese bereits verwendet werden, insbesondere fokussieren wir uns hier auch auf gängige Visualisierungsmethoden und die damit zusammenhängenden Limitationen. Beides wollen wir durch praktische Übungen an eigenen oder bereitgestellten Datensätzen näherbringen.

Zum Abschluss bieten wir konkrete Möglichkeiten an, welche Visualisierungen auf welche Weise ihren Platz als literaturwissenschaftliche Methode finden können.

15: Projektmanagement für die Digital Humanities | Markus Frank*

Markus Frank | Raum: HG/108

Je umfangreicher Projekte in den Digital Humanities werden, je komplexer und interdisziplinärer, umso größer wird die Gefahr einer defizitären Umsetzung und umso wichtiger werden die Anforderungen an die Planung und Organisation der Projektbestandteile. Professionelles Projektmanagement spielt jedoch zum aktuellen Zeitpunkt eine allenfalls untergeordnete Rolle, sowohl in DH-Projekten als auch in der Ausbildung, obwohl der wachsende Bedarf durchaus bekannt ist. Ziel des Workshops ist es, den Teilnehmenden Einblicke in die Bereiche Projektplanung, klassisches Projektmanagement, agiles Projektmanagement und zentrale Problemfelder in DH-Projekten zu geben. Ergänzend sollen die Teilnehmenden ihre eigenen Erfahrungen in DH-Forschungsprojekten reflektieren und handlungspraktisches Wissen für das Management von interdisziplinären Projekten erwerben: Wie plant man komplexe Projekte, die darin enthaltenen Arbeitspakete und optimiert deren Durchlauf? Welche Vorgehensmodelle aus dem IT-Projektmanagement sind für DH-Projekte sinnvoll? Können agile Methoden zielführend in Projekte integriert werden? Letztendlich: Wie kann die Wahrscheinlichkeit auf erfolgreichen Projektabschluss verbessert werden, trotz wachsender Komplexität sowie interdisziplinärem Abstimmungsbedarf in DH-Projekten?

16: FAIRes Datenmanagement mit dem DARIAH-DE Repository | Melina Jander*, Lukas Weimer*

Melina Jander, Lukas Weimer | Raum: 3/108

Mit dem DARIAH-DE Repository können sowohl Individualforschende als auch Forschungsinstitutionen und weitere Datengeber unter Berücksichtigung der FAIR-Prinzipien ihre Daten dauerhaft und referenzierbar publizieren und speichern. Eingebettet in die Infrastruktur von DARIAH- und CLARIAH-DE garantiert das Repository Nachhaltigkeit und Support – und somit ein hohes Maß an Nutzendenfreundlichkeit. Für die Verwendung ist lediglich ein DARIAH- oder Föderationsaccount nötig und es entstehen keine Kosten auf Seiten der Nutzenden. In dem halbtägigen Workshop wird das Dateneingabewerkzeug des DARIAH-DE Repositorys, der Publikator, vorgestellt und gemeinsam mit den Teilnehmenden ausprobiert. Der Hands-On-Charakter des Workshops wird in Form von Impulsvorträgen über FAIRes Datenmanagement und die technische Einbettung des Repositorys in seine Umgebung, die DARIAH-DE Datenföderationsrachitektur, angereichert.

17: Einführung in DraCor – Programmable Corpora für die digitale Dramenanalyse | Ingo Börner*, Frank Fischer*, Carsten Milling*, Henny Sluyter-Gäthje*

Ingo Börner, Frank Fischer, Carsten Milling, Henny Sluyter-Gäthje | Raum: D/011

Der ganztägige Workshop führt in DraCor (https://dracor.org) ein. Hierbei handelt es sich um eine offene Plattform zur Erforschung von Dramen in verschiedenen Sprachen. Anhand von praktischen Beispielen erlernen die Teilnehmer*innen Methoden der digitalen Dramenanalyse. Zunächst erfolgt eine Vorstellung des Konzepts der “Programmable Corpora” – infrastrukturell-forschungsorientierte, offene, erweiterbare, LOD-freundliche Volltextkorpora, die es ermöglichen sollen, auf niederschwellige Weise diverse Forschungsfragen aus dem Bereich der digitalen Literaturwissenschaft datenbasiert, nachvollziehbar und reproduzierbar zu bearbeiten. Danach wird in Hands-on-Tutorials in Kleingruppen eine praktische Einführung in das Erstellen von TEI-Dramenkorpora zur Analyse mit DraCor gegeben. Praktische Beispiele zu stilometrischen und netzwerkanalytischen Untersuchungen von Dramen führen in die Verwendung der DraCor-API ein. Ebenso werden Möglichkeiten zu korpusübergreifenden Abfragen und Einbeziehung von Informationen aus der Linked-Open-Data-Cloud mit SPARQL erprobt.

18: Flexibles Arbeiten mit OCR4all – Massenvolltextdigitalisierung von Drucken mithilfe von OCR-D und hochqualitative Transkription von Handschriften | Florian Langhanki*, Maximilian Wehner*, Konstantin Baierer, Lena Hinrichsen*, Christian Reul

Florian Langhanki, Maximilian Wehner, Konstantin Baierer, Lena Hinrichsen, Christian Reul | Raum: HG/067

Die automatisierte Texterkennung von historischen Drucken und Handschriften stellt eine anspruchsvolle Aufgabe bei der Entwicklung modularer wie flexibler OCR-/HTR-Workflows dar. Besonders Forschungsfelder wie Text Mining oder Sentiment Analysis haben die Schwierigkeiten einer Textdigitalisierung entsprechender Materialien bei gleichzeitigem Bedarf großer Textmengen zur Anwendung quantitativer Analyseverfahren erkannt. Auch im Kontext hochqualitativer Volltexterfassungen digitaler Editionen besteht großer Bedarf an intuitiv und komfortabel zu bedienender Software.

Die an der Universität Würzburg entwickelte Software OCR4all nimmt neben den formulierten Anforderungen entsprechender Workflowsysteme die Ausrichtung auf einen geisteswissenschaftlichen Nutzer:innenkreis für sich in Anspruch. Durch die baldige Unterstützung der im Rahmen von OCR-D entwickelten Lösungen wird nun die Anwendung im Spannungsfeld einer Massenvolltextdigitalisierung und einer hochqualitativen Erfassung historischer Texte möglich.

Der Workshop bietet einen umfassenden Einstieg ins Thema der OCR und HTR historischer Materialien. Teilnehmende werden in die Nutzung von OCR4all eingeführt und dazu befähigt, auf Grundlage anspruchsvoller Ausgangsmaterialien hochqualitative Textdaten zu generieren.

}

10:45 – 11:15

Fachhochschule Potsdam

Campus Kiepenheuerallee,
diverse, Foyer

Kaffeepause

}

11:15 – 13:00

Fachhochschule Potsdam

Campus Kiepenheuerallee,
diverse, s. Workshops

Workshops 2b

10: Vom Begriff über das Phänomen zur Analyse – ein CRETA-Workshop zur Operationalisierung in den DH | Melanie Andresen*, Benjamin Krautter*, Janis Pagel*, Axel Pichler*

Melanie Andresen, Benjamin Krautter, Janis Pagel, Axel Pichler | Raum: 2/014

Der Workshop stellt eine weiterentwickelte und personell anders besetzte Version eines auf der DHd 2020 abgehaltenen Workshops dar. Er adressiert mit dem Konzept und der Praxis der Operationalisierung eine der zentralen Herausforderungen für Arbeiten in den DH. Während Geisteswissenschaftler*innen vor allem mit komplexen, häufig mehrere Textphänomene umfassenden Konzepten arbeiten, ist die computergestützte Arbeit an identifizierbare Phänomene auf der Textoberfläche gebunden. Die hieraus erwachsende Diskrepanz zwischen theoretischen Erwartungen und konkreten Ergebnissen gilt es über eine adäquate Operationalisierung, also die Erkennung und Messbarmachung theoretischer Konzepte, zu überbrücken. Der Workshop will diese Schnittstelle in den Fokus rücken. Anhand ausgewählter Anwendungsfälle soll gezeigt werden, welche Herausforderungen sich aus dem Einsatz computergestützter Methoden für geisteswissenschaftliche Fragestellungen ergeben und wie mit ihnen umgegangen werden kann. In einem praktischen Teil haben die Teilnehmenden die Möglichkeit, an der Operationalisierung vorgegebener exemplarischer Fragestellungen der Textanalyse und der für sie relevanten Konzepte zu arbeiten.

11: Annotorious - eine JavaScript-Bibliothek für die Entwicklung maßgeschneiderter Bildannotationstools | Simon Rainer*, Erik Radisch*

Simon Rainer, Erik Radisch | Raum: 3/001

Annotorious ist eine JavaScript-Bibliothek, mit deren Hilfe es möglich ist, mit wenig Aufwand eine Bildannotationsumgebung zu programmieren. Trotz seiner Einfachheit ist sehr flexibel und bietet viele Möglichkeiten zur Anpassung und Erweiterung, wodurch es gerade für geisteswissenschaftliche Forschungsprojekte interessant ist, wo die Anforderungen an Annotationswerkzeuge stark variieren.

Ziel des Workshops ist es, den Teilnehmern umfassenden Einblick in den Funktionsumfang und in die Einsatzmöglichkeiten von Annotorious zu geben, und sie in die Lage zu versetzen, selbstständig Annotationsumgebungen zu erstellen, sie gemäß den eigenen Forschungsbedürfnissen individuell anzupassen, und über Plugins zu erweitern. Im Rahmen von praktischen Übungen werden die Teilnehmer dazu Basisszenarios auf dem eigenen Notebook entwickeln und Grundkomponenten (visuelles Erscheinungsbild, Annotations-Editor) anpassen.

12: Workshop: Repräsentativität in digitalen Archiven | Corinna Dziudzia*, Mark Hall*

Corinna Dziudzia, Mark Hall | Raum: 3/006

Die „Kulturen des digitalen Gedächtnisses“ operieren vor dem Hintergrund eines Spannungsfelds, das man auf eine Dichotomie von Kanon und Archiv zuspitzen kann. Die Komplexität in dieser Frage ergibt sich nicht zuletzt daraus, dass die Interessen und Anforderungen einer Reihe von Akteuren zusammentreffen: Geisteswissenschaftler_innen, Archivar_innen, Geldgeber_innnen und Informatiker_innen. Jede dieser Gruppen hat unterschiedliche Sichtweisen darauf, was Repräsentativität für sie bedeutet, aber was fehlt, ist ein Forum, in dem ein kontinuierlicher Austausch über diese Fragen über die Gruppengrenzen hinweg möglich ist. Der hier vorgeschlagene ganztägige Workshop für die DHd 2022 stellt einen ersten Schritt in diese Richtung dar, mit zwei geplanten Outputs: einem Positionspapier und der Gründung einer DHd-Arbeitsgruppe “Repräsentativität”. Es bestehen zwar schon akteursspezifische AGs (Datenzentren, DH Theory, OCR), die AG “Repräsentativität” wird aber Akteur_innen über Gruppengrenzen hinweg zusammenbringen, was unsere Vorarbeit als notwendig identifiziert hat.

13: GitMA oder CATMA für Fortgeschrittene – Projektdaten via Git abrufen und mittels Python-Bibliothek weiterverarbeiten | Mareike Schumacher*, Michael Vauth*, Dominik Gerstorfer*, Malte Meister*

Mareike Schumacher, Michael Vauth, Dominik Gerstorfer, Malte Meister | Raum: 3/008

Dieser CATMA-6-Workshop richtet sich an fortgeschrittene CATMA User*innen mit Vorkenntnissen in digitaler Annotation, die im Rahmen der eigenen Arbeit oder von Forschungsprojekten mit größeren Mengen von Annotationsdaten operieren (wollen). Im Zentrum steht die Weiterverarbeitung und Analyse von Annotationsdaten. Wie greife ich über Git auf meine CATMA-Annotationsdaten zu? Wie erstelle ich individuelle, interaktive Visualisierungen meiner Annotationsdaten? Wie berechne ich die Übereinstimmung zwischen mehreren Annotator*innen? Diese und ähnliche Fragen werden während des Workshops beantwortet.

14: Textexplorationen in der digitalen Literaturwissenschaft: eine kritische und angewandte Auseinandersetzung mit Repräsentations- und Interpretationsansätzen von Text | Stephanie Brandl*, David Lassner*, Cora Krömer*, Anne Baillot*

Stephanie Brandl, David Lassner, Cora Krömer, Anne Baillot | Raum: 3/012

In dem Workshop möchten wir uns der Thematik des Lesens und der vektoriellen Textrepräsentation von zwei Seiten nähern, wir geben (1) einen Überblick über die traditionellen Theorien des Lesens und kontextualisieren sie mit Erkenntnissen aus neurowissenschaftlichen Laborstudien. Wir geben (2) eine Zusammenfassung der aktuellen Methoden zu Textrepräsentation [z.B. Glove, Bert] und Beispiele für DH-Projekte, in denen diese bereits verwendet werden, insbesondere fokussieren wir uns hier auch auf gängige Visualisierungsmethoden und die damit zusammenhängenden Limitationen. Beides wollen wir durch praktische Übungen an eigenen oder bereitgestellten Datensätzen näherbringen.

Zum Abschluss bieten wir konkrete Möglichkeiten an, welche Visualisierungen auf welche Weise ihren Platz als literaturwissenschaftliche Methode finden können.

15: Projektmanagement für die Digital Humanities | Markus Frank*

Markus Frank | Raum: HG/108

Je umfangreicher Projekte in den Digital Humanities werden, je komplexer und interdisziplinärer, umso größer wird die Gefahr einer defizitären Umsetzung und umso wichtiger werden die Anforderungen an die Planung und Organisation der Projektbestandteile. Professionelles Projektmanagement spielt jedoch zum aktuellen Zeitpunkt eine allenfalls untergeordnete Rolle, sowohl in DH-Projekten als auch in der Ausbildung, obwohl der wachsende Bedarf durchaus bekannt ist. Ziel des Workshops ist es, den Teilnehmenden Einblicke in die Bereiche Projektplanung, klassisches Projektmanagement, agiles Projektmanagement und zentrale Problemfelder in DH-Projekten zu geben. Ergänzend sollen die Teilnehmenden ihre eigenen Erfahrungen in DH-Forschungsprojekten reflektieren und handlungspraktisches Wissen für das Management von interdisziplinären Projekten erwerben: Wie plant man komplexe Projekte, die darin enthaltenen Arbeitspakete und optimiert deren Durchlauf? Welche Vorgehensmodelle aus dem IT-Projektmanagement sind für DH-Projekte sinnvoll? Können agile Methoden zielführend in Projekte integriert werden? Letztendlich: Wie kann die Wahrscheinlichkeit auf erfolgreichen Projektabschluss verbessert werden, trotz wachsender Komplexität sowie interdisziplinärem Abstimmungsbedarf in DH-Projekten?

16: FAIRes Datenmanagement mit dem DARIAH-DE Repository | Melina Jander*, Lukas Weimer*

Melina Jander, Lukas Weimer | Raum: 3/108

Mit dem DARIAH-DE Repository können sowohl Individualforschende als auch Forschungsinstitutionen und weitere Datengeber unter Berücksichtigung der FAIR-Prinzipien ihre Daten dauerhaft und referenzierbar publizieren und speichern. Eingebettet in die Infrastruktur von DARIAH- und CLARIAH-DE garantiert das Repository Nachhaltigkeit und Support – und somit ein hohes Maß an Nutzendenfreundlichkeit. Für die Verwendung ist lediglich ein DARIAH- oder Föderationsaccount nötig und es entstehen keine Kosten auf Seiten der Nutzenden. In dem halbtägigen Workshop wird das Dateneingabewerkzeug des DARIAH-DE Repositorys, der Publikator, vorgestellt und gemeinsam mit den Teilnehmenden ausprobiert. Der Hands-On-Charakter des Workshops wird in Form von Impulsvorträgen über FAIRes Datenmanagement und die technische Einbettung des Repositorys in seine Umgebung, die DARIAH-DE Datenföderationsrachitektur, angereichert.

17: Einführung in DraCor – Programmable Corpora für die digitale Dramenanalyse | Ingo Börner*, Frank Fischer*, Carsten Milling*, Henny Sluyter-Gäthje*

Ingo Börner, Frank Fischer, Carsten Milling, Henny Sluyter-Gäthje | Raum: D/011

Der ganztägige Workshop führt in DraCor (https://dracor.org) ein. Hierbei handelt es sich um eine offene Plattform zur Erforschung von Dramen in verschiedenen Sprachen. Anhand von praktischen Beispielen erlernen die Teilnehmer*innen Methoden der digitalen Dramenanalyse. Zunächst erfolgt eine Vorstellung des Konzepts der “Programmable Corpora” – infrastrukturell-forschungsorientierte, offene, erweiterbare, LOD-freundliche Volltextkorpora, die es ermöglichen sollen, auf niederschwellige Weise diverse Forschungsfragen aus dem Bereich der digitalen Literaturwissenschaft datenbasiert, nachvollziehbar und reproduzierbar zu bearbeiten. Danach wird in Hands-on-Tutorials in Kleingruppen eine praktische Einführung in das Erstellen von TEI-Dramenkorpora zur Analyse mit DraCor gegeben. Praktische Beispiele zu stilometrischen und netzwerkanalytischen Untersuchungen von Dramen führen in die Verwendung der DraCor-API ein. Ebenso werden Möglichkeiten zu korpusübergreifenden Abfragen und Einbeziehung von Informationen aus der Linked-Open-Data-Cloud mit SPARQL erprobt.

18: Flexibles Arbeiten mit OCR4all – Massenvolltextdigitalisierung von Drucken mithilfe von OCR-D und hochqualitative Transkription von Handschriften | Florian Langhanki*, Maximilian Wehner*, Konstantin Baierer, Lena Hinrichsen*, Christian Reul

Florian Langhanki, Maximilian Wehner, Konstantin Baierer, Lena Hinrichsen, Christian Reul | Raum: HG/067

Die automatisierte Texterkennung von historischen Drucken und Handschriften stellt eine anspruchsvolle Aufgabe bei der Entwicklung modularer wie flexibler OCR-/HTR-Workflows dar. Besonders Forschungsfelder wie Text Mining oder Sentiment Analysis haben die Schwierigkeiten einer Textdigitalisierung entsprechender Materialien bei gleichzeitigem Bedarf großer Textmengen zur Anwendung quantitativer Analyseverfahren erkannt. Auch im Kontext hochqualitativer Volltexterfassungen digitaler Editionen besteht großer Bedarf an intuitiv und komfortabel zu bedienender Software.

Die an der Universität Würzburg entwickelte Software OCR4all nimmt neben den formulierten Anforderungen entsprechender Workflowsysteme die Ausrichtung auf einen geisteswissenschaftlichen Nutzer:innenkreis für sich in Anspruch. Durch die baldige Unterstützung der im Rahmen von OCR-D entwickelten Lösungen wird nun die Anwendung im Spannungsfeld einer Massenvolltextdigitalisierung und einer hochqualitativen Erfassung historischer Texte möglich.

Der Workshop bietet einen umfassenden Einstieg ins Thema der OCR und HTR historischer Materialien. Teilnehmende werden in die Nutzung von OCR4all eingeführt und dazu befähigt, auf Grundlage anspruchsvoller Ausgangsmaterialien hochqualitative Textdaten zu generieren.

}

13:00 – 13:30

Fachhochschule Potsdam

Campus Kiepenheuerallee,
Seminarraum

Chorprobe

Chorleiter: Torsten Roeder

}

13:00 – 14:00

Fachhochschule Potsdam

Campus Kiepenheuerallee,
Mensa

Mittagspause

}

14:00 – 15:30

Fachhochschule Potsdam

Campus Kiepenheuerallee,
diverse, s. Workshops

Workshops 3a (Ganztagesworkshops)

12: Workshop: Repräsentativität in digitalen Archiven | Corinna Dziudzia*, Mark Hall*

Corinna Dziudzia, Mark Hall | Raum: 3/006

Die „Kulturen des digitalen Gedächtnisses“ operieren vor dem Hintergrund eines Spannungsfelds, das man auf eine Dichotomie von Kanon und Archiv zuspitzen kann. Die Komplexität in dieser Frage ergibt sich nicht zuletzt daraus, dass die Interessen und Anforderungen einer Reihe von Akteuren zusammentreffen: Geisteswissenschaftler_innen, Archivar_innen, Geldgeber_innnen und Informatiker_innen. Jede dieser Gruppen hat unterschiedliche Sichtweisen darauf, was Repräsentativität für sie bedeutet, aber was fehlt, ist ein Forum, in dem ein kontinuierlicher Austausch über diese Fragen über die Gruppengrenzen hinweg möglich ist. Der hier vorgeschlagene ganztägige Workshop für die DHd 2022 stellt einen ersten Schritt in diese Richtung dar, mit zwei geplanten Outputs: einem Positionspapier und der Gründung einer DHd-Arbeitsgruppe “Repräsentativität”. Es bestehen zwar schon akteursspezifische AGs (Datenzentren, DH Theory, OCR), die AG “Repräsentativität” wird aber Akteur_innen über Gruppengrenzen hinweg zusammenbringen, was unsere Vorarbeit als notwendig identifiziert hat.

13: GitMA oder CATMA für Fortgeschrittene – Projektdaten via Git abrufen und mittels Python-Bibliothek weiterverarbeiten | Mareike Schumacher*, Michael Vauth*, Dominik Gerstorfer*, Malte Meister*

Mareike Schumacher, Michael Vauth, Dominik Gerstorfer, Malte Meister | Raum: 3/008

Dieser CATMA-6-Workshop richtet sich an fortgeschrittene CATMA User*innen mit Vorkenntnissen in digitaler Annotation, die im Rahmen der eigenen Arbeit oder von Forschungsprojekten mit größeren Mengen von Annotationsdaten operieren (wollen). Im Zentrum steht die Weiterverarbeitung und Analyse von Annotationsdaten. Wie greife ich über Git auf meine CATMA-Annotationsdaten zu? Wie erstelle ich individuelle, interaktive Visualisierungen meiner Annotationsdaten? Wie berechne ich die Übereinstimmung zwischen mehreren Annotator*innen? Diese und ähnliche Fragen werden während des Workshops beantwortet.

14: Textexplorationen in der digitalen Literaturwissenschaft: eine kritische und angewandte Auseinandersetzung mit Repräsentations- und Interpretationsansätzen von Text | Stephanie Brandl*, David Lassner*, Cora Krömer*, Anne Baillot*

Stephanie Brandl, David Lassner, Cora Krömer, Anne Baillot | Raum: 3/012

In dem Workshop möchten wir uns der Thematik des Lesens und der vektoriellen Textrepräsentation von zwei Seiten nähern, wir geben (1) einen Überblick über die traditionellen Theorien des Lesens und kontextualisieren sie mit Erkenntnissen aus neurowissenschaftlichen Laborstudien. Wir geben (2) eine Zusammenfassung der aktuellen Methoden zu Textrepräsentation [z.B. Glove, Bert] und Beispiele für DH-Projekte, in denen diese bereits verwendet werden, insbesondere fokussieren wir uns hier auch auf gängige Visualisierungsmethoden und die damit zusammenhängenden Limitationen. Beides wollen wir durch praktische Übungen an eigenen oder bereitgestellten Datensätzen näherbringen.

Zum Abschluss bieten wir konkrete Möglichkeiten an, welche Visualisierungen auf welche Weise ihren Platz als literaturwissenschaftliche Methode finden können.

15: Projektmanagement für die Digital Humanities | Markus Frank*

Markus Frank | Raum: 3/106

Je umfangreicher Projekte in den Digital Humanities werden, je komplexer und interdisziplinärer, umso größer wird die Gefahr einer defizitären Umsetzung und umso wichtiger werden die Anforderungen an die Planung und Organisation der Projektbestandteile. Professionelles Projektmanagement spielt jedoch zum aktuellen Zeitpunkt eine allenfalls untergeordnete Rolle, sowohl in DH-Projekten als auch in der Ausbildung, obwohl der wachsende Bedarf durchaus bekannt ist. Ziel des Workshops ist es, den Teilnehmenden Einblicke in die Bereiche Projektplanung, klassisches Projektmanagement, agiles Projektmanagement und zentrale Problemfelder in DH-Projekten zu geben. Ergänzend sollen die Teilnehmenden ihre eigenen Erfahrungen in DH-Forschungsprojekten reflektieren und handlungspraktisches Wissen für das Management von interdisziplinären Projekten erwerben: Wie plant man komplexe Projekte, die darin enthaltenen Arbeitspakete und optimiert deren Durchlauf? Welche Vorgehensmodelle aus dem IT-Projektmanagement sind für DH-Projekte sinnvoll? Können agile Methoden zielführend in Projekte integriert werden? Letztendlich: Wie kann die Wahrscheinlichkeit auf erfolgreichen Projektabschluss verbessert werden, trotz wachsender Komplexität sowie interdisziplinärem Abstimmungsbedarf in DH-Projekten?

17: Einführung in DraCor – Programmable Corpora für die digitale Dramenanalyse | Ingo Börner*, Frank Fischer*, Carsten Milling*, Henny Sluyter-Gäthje*

Ingo Börner, Frank Fischer, Carsten Milling, Henny Sluyter-Gäthje | Raum: D/011

Der ganztägige Workshop führt in DraCor (https://dracor.org) ein. Hierbei handelt es sich um eine offene Plattform zur Erforschung von Dramen in verschiedenen Sprachen. Anhand von praktischen Beispielen erlernen die Teilnehmer*innen Methoden der digitalen Dramenanalyse. Zunächst erfolgt eine Vorstellung des Konzepts der “Programmable Corpora” – infrastrukturell-forschungsorientierte, offene, erweiterbare, LOD-freundliche Volltextkorpora, die es ermöglichen sollen, auf niederschwellige Weise diverse Forschungsfragen aus dem Bereich der digitalen Literaturwissenschaft datenbasiert, nachvollziehbar und reproduzierbar zu bearbeiten. Danach wird in Hands-on-Tutorials in Kleingruppen eine praktische Einführung in das Erstellen von TEI-Dramenkorpora zur Analyse mit DraCor gegeben. Praktische Beispiele zu stilometrischen und netzwerkanalytischen Untersuchungen von Dramen führen in die Verwendung der DraCor-API ein. Ebenso werden Möglichkeiten zu korpusübergreifenden Abfragen und Einbeziehung von Informationen aus der Linked-Open-Data-Cloud mit SPARQL erprobt.

18: Flexibles Arbeiten mit OCR4all – Massenvolltextdigitalisierung von Drucken mithilfe von OCR-D und hochqualitative Transkription von Handschriften | Florian Langhanki*, Maximilian Wehner*, Konstantin Baierer, Lena Hinrichsen*, Christian Reul

Florian Langhanki, Maximilian Wehner, Konstantin Baierer, Lena Hinrichsen, Christian Reul | Raum: HG/067

Die automatisierte Texterkennung von historischen Drucken und Handschriften stellt eine anspruchsvolle Aufgabe bei der Entwicklung modularer wie flexibler OCR-/HTR-Workflows dar. Besonders Forschungsfelder wie Text Mining oder Sentiment Analysis haben die Schwierigkeiten einer Textdigitalisierung entsprechender Materialien bei gleichzeitigem Bedarf großer Textmengen zur Anwendung quantitativer Analyseverfahren erkannt. Auch im Kontext hochqualitativer Volltexterfassungen digitaler Editionen besteht großer Bedarf an intuitiv und komfortabel zu bedienender Software.

Die an der Universität Würzburg entwickelte Software OCR4all nimmt neben den formulierten Anforderungen entsprechender Workflowsysteme die Ausrichtung auf einen geisteswissenschaftlichen Nutzer:innenkreis für sich in Anspruch. Durch die baldige Unterstützung der im Rahmen von OCR-D entwickelten Lösungen wird nun die Anwendung im Spannungsfeld einer Massenvolltextdigitalisierung und einer hochqualitativen Erfassung historischer Texte möglich.

Der Workshop bietet einen umfassenden Einstieg ins Thema der OCR und HTR historischer Materialien. Teilnehmende werden in die Nutzung von OCR4all eingeführt und dazu befähigt, auf Grundlage anspruchsvoller Ausgangsmaterialien hochqualitative Textdaten zu generieren.

}

15:30 – 16:00

Fachhochschule Potsdam

Campus Kiepenheuerallee,

diverse, Foyer

Kaffeepause

}

16:00 – 17:00

Fachhochschule Potsdam

Campus Kiepenheuerallee,
diverse, s. Workshops

Workshops 3b (Ganztagesworkshops)

12: Workshop: Repräsentativität in digitalen Archiven | Corinna Dziudzia*, Mark Hall*

Corinna Dziudzia, Mark Hall | Raum: 3/006

Die „Kulturen des digitalen Gedächtnisses“ operieren vor dem Hintergrund eines Spannungsfelds, das man auf eine Dichotomie von Kanon und Archiv zuspitzen kann. Die Komplexität in dieser Frage ergibt sich nicht zuletzt daraus, dass die Interessen und Anforderungen einer Reihe von Akteuren zusammentreffen: Geisteswissenschaftler_innen, Archivar_innen, Geldgeber_innnen und Informatiker_innen. Jede dieser Gruppen hat unterschiedliche Sichtweisen darauf, was Repräsentativität für sie bedeutet, aber was fehlt, ist ein Forum, in dem ein kontinuierlicher Austausch über diese Fragen über die Gruppengrenzen hinweg möglich ist. Der hier vorgeschlagene ganztägige Workshop für die DHd 2022 stellt einen ersten Schritt in diese Richtung dar, mit zwei geplanten Outputs: einem Positionspapier und der Gründung einer DHd-Arbeitsgruppe “Repräsentativität”. Es bestehen zwar schon akteursspezifische AGs (Datenzentren, DH Theory, OCR), die AG “Repräsentativität” wird aber Akteur_innen über Gruppengrenzen hinweg zusammenbringen, was unsere Vorarbeit als notwendig identifiziert hat.

13: GitMA oder CATMA für Fortgeschrittene – Projektdaten via Git abrufen und mittels Python-Bibliothek weiterverarbeiten | Mareike Schumacher*, Michael Vauth*, Dominik Gerstorfer*, Malte Meister*

Mareike Schumacher, Michael Vauth, Dominik Gerstorfer, Malte Meister | Raum: 3/008

Dieser CATMA-6-Workshop richtet sich an fortgeschrittene CATMA User*innen mit Vorkenntnissen in digitaler Annotation, die im Rahmen der eigenen Arbeit oder von Forschungsprojekten mit größeren Mengen von Annotationsdaten operieren (wollen). Im Zentrum steht die Weiterverarbeitung und Analyse von Annotationsdaten. Wie greife ich über Git auf meine CATMA-Annotationsdaten zu? Wie erstelle ich individuelle, interaktive Visualisierungen meiner Annotationsdaten? Wie berechne ich die Übereinstimmung zwischen mehreren Annotator*innen? Diese und ähnliche Fragen werden während des Workshops beantwortet.

14: Textexplorationen in der digitalen Literaturwissenschaft: eine kritische und angewandte Auseinandersetzung mit Repräsentations- und Interpretationsansätzen von Text | Stephanie Brandl*, David Lassner*, Cora Krömer*, Anne Baillot*

Stephanie Brandl, David Lassner, Cora Krömer, Anne Baillot | Raum: 3/012

In dem Workshop möchten wir uns der Thematik des Lesens und der vektoriellen Textrepräsentation von zwei Seiten nähern, wir geben (1) einen Überblick über die traditionellen Theorien des Lesens und kontextualisieren sie mit Erkenntnissen aus neurowissenschaftlichen Laborstudien. Wir geben (2) eine Zusammenfassung der aktuellen Methoden zu Textrepräsentation [z.B. Glove, Bert] und Beispiele für DH-Projekte, in denen diese bereits verwendet werden, insbesondere fokussieren wir uns hier auch auf gängige Visualisierungsmethoden und die damit zusammenhängenden Limitationen. Beides wollen wir durch praktische Übungen an eigenen oder bereitgestellten Datensätzen näherbringen.

Zum Abschluss bieten wir konkrete Möglichkeiten an, welche Visualisierungen auf welche Weise ihren Platz als literaturwissenschaftliche Methode finden können.

15: Projektmanagement für die Digital Humanities | Markus Frank*

Markus Frank | Raum: 3/106

Je umfangreicher Projekte in den Digital Humanities werden, je komplexer und interdisziplinärer, umso größer wird die Gefahr einer defizitären Umsetzung und umso wichtiger werden die Anforderungen an die Planung und Organisation der Projektbestandteile. Professionelles Projektmanagement spielt jedoch zum aktuellen Zeitpunkt eine allenfalls untergeordnete Rolle, sowohl in DH-Projekten als auch in der Ausbildung, obwohl der wachsende Bedarf durchaus bekannt ist. Ziel des Workshops ist es, den Teilnehmenden Einblicke in die Bereiche Projektplanung, klassisches Projektmanagement, agiles Projektmanagement und zentrale Problemfelder in DH-Projekten zu geben. Ergänzend sollen die Teilnehmenden ihre eigenen Erfahrungen in DH-Forschungsprojekten reflektieren und handlungspraktisches Wissen für das Management von interdisziplinären Projekten erwerben: Wie plant man komplexe Projekte, die darin enthaltenen Arbeitspakete und optimiert deren Durchlauf? Welche Vorgehensmodelle aus dem IT-Projektmanagement sind für DH-Projekte sinnvoll? Können agile Methoden zielführend in Projekte integriert werden? Letztendlich: Wie kann die Wahrscheinlichkeit auf erfolgreichen Projektabschluss verbessert werden, trotz wachsender Komplexität sowie interdisziplinärem Abstimmungsbedarf in DH-Projekten?

17: Einführung in DraCor – Programmable Corpora für die digitale Dramenanalyse | Ingo Börner*, Frank Fischer*, Carsten Milling*, Henny Sluyter-Gäthje*

Ingo Börner, Frank Fischer, Carsten Milling, Henny Sluyter-Gäthje | Raum: D/011

Der ganztägige Workshop führt in DraCor (https://dracor.org) ein. Hierbei handelt es sich um eine offene Plattform zur Erforschung von Dramen in verschiedenen Sprachen. Anhand von praktischen Beispielen erlernen die Teilnehmer*innen Methoden der digitalen Dramenanalyse. Zunächst erfolgt eine Vorstellung des Konzepts der “Programmable Corpora” – infrastrukturell-forschungsorientierte, offene, erweiterbare, LOD-freundliche Volltextkorpora, die es ermöglichen sollen, auf niederschwellige Weise diverse Forschungsfragen aus dem Bereich der digitalen Literaturwissenschaft datenbasiert, nachvollziehbar und reproduzierbar zu bearbeiten. Danach wird in Hands-on-Tutorials in Kleingruppen eine praktische Einführung in das Erstellen von TEI-Dramenkorpora zur Analyse mit DraCor gegeben. Praktische Beispiele zu stilometrischen und netzwerkanalytischen Untersuchungen von Dramen führen in die Verwendung der DraCor-API ein. Ebenso werden Möglichkeiten zu korpusübergreifenden Abfragen und Einbeziehung von Informationen aus der Linked-Open-Data-Cloud mit SPARQL erprobt.

18: Flexibles Arbeiten mit OCR4all – Massenvolltextdigitalisierung von Drucken mithilfe von OCR-D und hochqualitative Transkription von Handschriften | Florian Langhanki*, Maximilian Wehner*, Konstantin Baierer, Lena Hinrichsen*, Christian Reul

Florian Langhanki, Maximilian Wehner, Konstantin Baierer, Lena Hinrichsen, Christian Reul | Raum: HG/067

Die automatisierte Texterkennung von historischen Drucken und Handschriften stellt eine anspruchsvolle Aufgabe bei der Entwicklung modularer wie flexibler OCR-/HTR-Workflows dar. Besonders Forschungsfelder wie Text Mining oder Sentiment Analysis haben die Schwierigkeiten einer Textdigitalisierung entsprechender Materialien bei gleichzeitigem Bedarf großer Textmengen zur Anwendung quantitativer Analyseverfahren erkannt. Auch im Kontext hochqualitativer Volltexterfassungen digitaler Editionen besteht großer Bedarf an intuitiv und komfortabel zu bedienender Software.

Die an der Universität Würzburg entwickelte Software OCR4all nimmt neben den formulierten Anforderungen entsprechender Workflowsysteme die Ausrichtung auf einen geisteswissenschaftlichen Nutzer:innenkreis für sich in Anspruch. Durch die baldige Unterstützung der im Rahmen von OCR-D entwickelten Lösungen wird nun die Anwendung im Spannungsfeld einer Massenvolltextdigitalisierung und einer hochqualitativen Erfassung historischer Texte möglich.

Der Workshop bietet einen umfassenden Einstieg ins Thema der OCR und HTR historischer Materialien. Teilnehmende werden in die Nutzung von OCR4all eingeführt und dazu befähigt, auf Grundlage anspruchsvoller Ausgangsmaterialien hochqualitative Textdaten zu generieren.

}

17:00 – 18:30

Universität Potsdam

Campus Griebnitzsee, Hörsäle H3/H4

individuelle Anfahrt nach Griebnitzsee

Bitte beachten Sie, dass die weiteren Programmpunkte am Campus Griebnitzsee der Universität Potsdam stattfinden

Die Anfahrt mit den öffentlichen Verkehrsmitteln dauert etwa 30 Minuten.

}

18:30 – 20:00

Universität Potsdam

Campus Griebnitzsee, Hörsäle H3/H4

Eröffnungskeynote

N. N.

}

20:00 – 22:00

Universität Potsdam

Campus Griebnitzsee, Foyer

Eröffnungsempfang