Zum Hauptinhalt springen

Wenn Dramen durch den Rechner laufen – Die Literaturwissenschaft wird digital

Peer Trilcke, Professor für deutsche Literatur des 19. Jahrhunderts und Leiter des Theodor-Fontane-Archivs.
Henny Sluyter-Gäthje, wissenschaftliche Mitarbeiterin an der Professur für deutsche Literatur des 19. Jahrhunderts.
Eine Netzwerkvisualisierung zu Goethes Drama „Götz von Berlichingen mit der eisernen Hand“.
Foto : Tobias Hopfgarten
Peer Trilcke, Professor für deutsche Literatur des 19. Jahrhunderts und Leiter des Theodor-Fontane-Archivs.
Foto : Tobias Hopfgarten
Henny Sluyter-Gäthje, wissenschaftliche Mitarbeiterin an der Professur für deutsche Literatur des 19. Jahrhunderts.
Bild : Peer Trilcke
Eine Netzwerkvisualisierung zu Goethes Drama „Götz von Berlichingen mit der eisernen Hand“.

Wer Literatur erforscht, verbringt seine Zeit in Bibliotheken und Archiven, wälzt Bücher und Dokumente, arbeitet sich lesend durch Berge von Texten und macht sich Notizen auf Papier. Peer Trilcke, Professor für deutsche Literatur des 19. Jahrhunderts und Leiter des Theodor-Fontane-Archivs, kennt diese Vorstellungen über sein Forschungsfeld und sagt: „Als Literaturwissenschaftlerin benötigt man nur einen Schreibtisch und ein Buch – das ist eine häufige Annahme.“ Doch in der modernen Literaturwissenschaft haben längst digitale Verfahren Einzug gehalten und die Arbeit der Forschenden verändert. „Unterstützt durch Computer und Programme kann man anders mit Texten interagieren und ganz neue Fragen stellen“, erklärt der Forscher.

Was er damit meint, projiziert er kurzerhand auf den Wandmonitor im Büro seines Instituts: Die Abbildung zeigt viele Punkte, die durch Linien miteinander verbunden sind und ein netzartiges Muster bilden. „Das ist das erste deutsche Drama, das sich offensiv in die Tradition Shakespeares stellt: ‚Götz von Berlichingen mit der eisernen Hand‘ von Johann Wolfgang von Goethe“, erklärt Peer Trilcke die Darstellung. Aus dem digitalisierten Werk konnten er und sein Team mithilfe eines Algorithmus neue Informationen extrahieren und sichtbar machen. Rund 3.000 europäische Dramen wurden im Forschungsprojekt DraCor (Drama Corpora Project) auf diese Weise bereits analysiert und dargestellt. „Jeder dieser Punkte ist eine Figur. Sobald sie miteinander auf der Bühne stehen, wird eine Linie gezogen“, beschreibt Peer Trilcke die Visualisierung und das Verfahren.

Fast 600 deutsche Dramen hat sich der Forscher mithilfe von DraCor genauer angeschaut und konnte daraus neue Erkenntnisse gewinnen. „Im 19. Jahrhundert verändert sich die Gesellschaft, sie wird zunehmend komplexer“, erklärt er. Immer mehr Menschen leben in Städten, wo sich soziale Beziehungen nicht nur innerhalb der Familie, sondern auch im Beruf oder in Freundeskreisen entwickeln. Die literarischen Werke dieser Zeit reflektieren diese Entwicklung. Das können die modernen, computergestützten Methoden nun in großem Maßstab sichtbar machen: „Die Netzwerkanalysen der Dramen zeigen diese Entwicklung erstmals Ende des 18. Jahrhunderts. Im 19. Jahrhundert werden die komplexen Beziehungsstrukturen in den Werken dann dominant“, so Trilcke.

DraCor steht Forschenden aus der ganzen Welt kostenlos online zur Verfügung. Die Plattform entstand in Kooperation der Uni Potsdam mit Forschenden aus Moskau. Inzwischen sind die Verbindungen nach Russland gekappt – aber die Forschung kann trotzdem weitergehen: „Die Beteiligten sind nach Europa geflüchtet und können hier zum Glück weiterarbeiten“, erklärt Peer Trilcke.

Was verrät Literatur über die jeweilige Zeit, in der sie entstanden ist? Was über gesellschaftliche Entwicklungen, Normen, Werte und Regeln? Kulturelle Trends können dank automatisierter Analysetools nun empirisch anhand großer Textmengen untersucht werden. Tausende oder gar Zehntausende Werke durchforsten die Programme innerhalb kürzester Zeit nach bestimmten Merkmalen und offenbaren so neue Strukturen und Beziehungen.

Henny Sluyter-Gäthje gehört zum Forschungsteam von Peer Trilcke und ist nicht nur Literaturwissenschaftlerin, sondern hat auch Informatik studiert. In ihrer Promotion entwickelt sie Algorithmen, die in der Lage sind, unterschiedliche Erzählperspektiven in Texten automatisch zu erkennen. Die bisherigen digitalen Instrumente können etwa Beziehungsstrukturen abbilden, grammatische und linguistische Informationen extrahieren oder auflisten, wie oft bestimmte Worte vorkommen und welche Figur am meisten spricht. Henny Sluyter-Gäthjes Ziel ist es, den Code auf das nächste Level zu heben, um noch anspruchsvollere Analysen zu ermöglichen.

„Es geht um die Frage, wie wir die Programme am besten verwenden können, um Literatur zu verstehen“, erklärt Peer Trilcke. „Literatur nutzt eine andere Sprache und hat auch andere Ziele als beispielsweise ein Zeitungsartikel.“ Um ihre Modelle gut zu trainieren, benötigt Henny Sluyter-Gäthje viele Textinformationen, die zunächst mit Stift und Papier von Forschenden erhoben wurden und wendet darauf Verfahren des maschinellen Lernens an. „Ich programmiere natürlich viel, arbeite aber gleichzeitig auch ganz klassisch mit Literatur“, erzählt die Doktorandin. „Auch bei mir liegen Bücher, die ich sehr konzentriert gelesen und mit vielen Klebezetteln markiert habe“, sagt sie lachend. Sie kennt beide Seiten der Literaturwissenschaft und weiß, dass digitale Verfahren nicht nur bislang unbekannte Forschungsfelder, sondern auch eine neue Art der Zusammenarbeit ermöglichen.

„Wir verschreiben uns dem Open Science-Gedanken“, erläutert Peer Trilcke. Die in seinem Team entwickelten Programme sind frei zugänglich, alle Arbeitsschritte sollen nachvollziehbar sein. Im europäischen Verbundprojekt „Computational Literary Studies Infrastructure (CLS INFRA) werden derzeit die dafür dringend benötigten Infrastrukturen entwickelt, um Textkorpora, Metadaten und Analysetools miteinander zu verknüpfen und zugänglich zu machen.

„Wir sind in vielen Bereichen noch ganz am Anfang, was das maschinelle Verständnis von Sprache, zumal ästhetischer Sprache betrifft“, erklärt Peer Trilcke. „Aber die Methoden entwickeln sich rasant.“ Der Forscher begleitet diese Entwicklung auch als Mit-Herausgeber eines Fachjournals, dessen erste Ausgabe kürzlich erschienen ist. Auch dabei gilt der Open Science-Gedanke: Die Artikel sind im Open Access publiziert, also frei und kostenlos zugänglich, ebenso wie die publizierten Daten und Software. Für den Forscher ist klar: Die Digitalisierung hat das Potenzial, das Grundverständnis der Literaturwissenschaft zu verändern. „In Zukunft forschen wir verstärkt internationaler, über Disziplinen hinweg und im Team.“

Die Ergebnisse des Drama Corpora Projects sind unter www.dracor.org öffentlich zugänglich.

Peer Trilcke ist Mitherausgeber des Fachjournals „Journal of Computational Literary Studies“, das unter https://jcls.io/ abrufbar ist.

Information zum EU-Projekt CLS INFRA gibt es unter https://clsinfra.io/

 

Dieser Text erschien im Universitätsmagazin Portal - Eins 2023 „Zukunft“ (PDF).