piwik-script

English Intern

    Neue Nachwuchsforschergruppe in den Digital Humanities

    28.05.2015

    Das BMBF fördert die Einrichtung einer Nachwuchsforschungsgruppe am Lehrstuhl für Computerphilologie an der Uni Würzburg. Das Team wird sich in den kommenden vier Jahren der "Computergestützten literarischen Gattungsstilistik" (CLiGS) im Bereich der Romanistik widmen.

    Einige “Topics” (etwa: Themen und Motive) aus französischen Theaterstücken der Klassik und Aufklärung, als “Wordcloud” visualisiert. Je größer ein Wort dargestellt ist, desto wichtiger ist es im jeweiligen Topic. (Grafik: C. Schöch, CLiGS)
    Einige “Topics” (etwa: Themen und Motive) aus französischen Theaterstücken der Klassik und Aufklärung, als “Wordcloud” visualisiert. Je größer ein Wort dargestellt ist, desto wichtiger ist es im jeweiligen Topic. (Grafik: C. Schöch, CLiGS)

    Am Institut für deutsche Philologie entsteht eine neue Nachwuchsforschungsgruppe unter Leitung von Christof Schöch. Sie gehört zum Lehrstuhl für Computerphilologie und Neuere Deutsche Literaturgeschichte von Professor Fotis Jannidis und wird in den kommenden vier Jahren vom  Bundesministerium für Bildung und Forschung (BMBF) mit etwa 1,8 Millionen Euro gefördert. Der Lehrstuhl kooperiert hierbei sehr eng mit Professor Andreas Hotho aus der Informatik und Romanistik-Professorin Brigitte Burrichter.

    "Der größte Teil der Förderung für die Digital Humanities besteht aus Mitteln für den Aufbau von Infrastrukturen. Reine Forschungsprojekte wie die Nachwuchsgruppen-Projekte sind vergleichsweise wenige zu finden, auch deshalb stellt das so anspruchsvolle wie ehrgeizige Projekt einer 'computergestützten literarischen Gattungsstilistik' etwas Besonderes dar", sagt Professor Jannidis.

    Größere Basis für Analysen und Interpretationen ermöglichen

    Gruppenleiter Christof Schöch und sein Team möchten im Rahmen des geförderten Projekts die Grundlagen schaffen, um literaturwissenschaftliche Fragestellungen durch eine Kombination umfangreicher Textdaten, innovativer Analysemethoden und geisteswissenschaftlicher Interpretationsleistungen in einer völlig neuen Weise bearbeiten zu können.

    Bislang ist es in den Literaturwissenschaften meist so, dass Untersuchungen an einigen wenigen Werken durchgeführt werden, da schlicht die Zeit nicht reicht, etwa alle Komödien aus einer Epoche zu lesen und in Relation zueinander zu setzen oder sie mit allen Tragödien aus der gleichen Zeit zu vergleichen. "Zudem sehen wir, dass beispielsweise in literaturgeschichtlichen Darstellungen immer wieder die gleichen literarischen Werke herangezogen werden", sagt Schöch. Damit würden vermeintlich allgemeingültige Aussagen über ganze Textgattungen und Epochen getroffen, die auf einer vergleichsweise kleinen Datenbasis beruhten.

    An dieser Stelle setzt die computergestützte literarische Gattungsstilistik an. Es soll in Zukunft möglich sein, eine deutlich größere Zahl an Texten vergleichend zu analysieren. Dies funktioniert beispielsweise, indem Computersoftware anhand verschiedener Wörter und Wortgruppen selbstständig gewisse wiederkehrende stilistische Mittel und Ausdrucksarten in Texten erkennt – unabhängig von Informationen über den Autor oder bereits bestehenden Einordnungen des Gesamtwerks. Diese erkannten Muster kann der Rechner dann ausgeben und der Philologe hat Ansatzpunkte für weitere Literaturarbeit. Im Zweifel nimmt er ein bestimmtes Buch aus dem Regal und liest es mit Blick auf seine konkrete Fragestellung.

    Die Forscher erhoffen sich neue methodische Ansätze zum Problem der Trennung der stilistischen Signale von Autorschaft und Gattung in literarischen Texten oder beispielsweise die automatische Erkennung von Deskription, Narration und Argumentation in Erzähltexten. Es sei denkbar, dass sich aus der Arbeit neben neuen Methoden auch neue Gattungsbegriffe entwickelten oder zumindest an bestehenden Zugehörigkeiten gerüttelt werden könnte, so Schöch.

    Fünf spanische und französische Textsammlungen als Grundlage

    Grundlage der Untersuchung sind fünf umfangreiche Textsammlungen. Christof Schöch widmet sich dem französischen und spanischen Theater der Klassik und Aufklärung. Eine bereits bestehende Sammlung französischer Theaterstücke enthält rund 750  Texte. Die weiteren Textsammlungen betreffen das spanische Theater des Siglo de Oro, den französischen Roman der Aufklärung, den spanischen Roman des 19. und frühen 20. Jahrhunderts und den lateinamerikanischen Roman des 19. Jahrhunderts.

    Während eine der von Christof Schöch verwendeten Sammlungen bereits gut aufbereitet ist, müssen die Wissenschaftler bei den anderen Sammlungen noch Vorarbeit leisten. "Es ist tatsächlich nicht ganz einfach, gut aufbereitete Daten zu bekommen", sagt Schöch, der selbst Romanistik, Anglistik und Psychologie in Freiburg und Tours studiert hat.

    Damit die Computer die Daten verwenden können, müssen sie entsprechend in einem einheitlichen, XML-basierten Format aufbereitet sein - bei vier Sammlungen steht diese Aufgabe noch aus. Ein Nebenprodukt der Projektarbeit ist also, dass die bearbeiteten Sammlungen für weitere Forscher mit vollkommen anderen Forschungsfragen dann bereits aufbereitet und verfügbar sind. Schöch, der seit Anfang 2014 die Arbeitsgruppe "Digitale Romanistik" im Deutschen Romanistenverband (DRV) koordiniert, stellt aber klar: "Es handelt sich hier um ein Projekt, bei dem Analyse und Interpretation im Mittelpunkt stehen, nicht die Digitalisierung."

    Enge Zusammenarbeit zwischen Romanisten und Informatikern

    "Im Fokus der Arbeitsgruppe steht natürlich der literaturwissenschaftliche wie informatische Erkenntnisgewinn. Sehr wichtig ist uns jedoch auch die Ausbildung der Nachwuchswissenschaftler und die Vernetzung, in Deutschland und darüber hinaus", sagt Schöch.

    Das Projekt hat nicht nur für die Julius-Maximilians-Universität Würzburg (die mit dem Lehrstuhl für Computerphilologie, dem Kallimachos-Zentrum für Digital Humanities, dem Digitalisierungszentrum der Bibliothek und zahlreichen Aktivitäten der Informatik ein starker DH-Standort ist) eine besondere Bedeutung, sondern auch für die Romanistik. "In Deutschland gibt es aktuell gerade zwei bis drei romanistische Vorhaben mit digitaler Methodik und vergleichbarem Umfang", sagt Schöch. "Die Konkurrenz um die Nachwuchsgruppen-Projekte war ausgesprochen groß, aber Christof Schöch ist es mit seinem exzellenten und innovativen Projekt gelungen, die Gutachter zu überzeugen, worüber ich mich sehr freue", sagt Lehrstuhlinhaber Fotis Jannidis.

    Dafür arbeitet Geisteswissenschaftler Schöch, der das Projekt bereits ein Jahr lang vorbereitet und in der Antragsphase betreut hat, in der Leitung der Nachwuchsforschergruppe eng mit der Informatik zusammen. Neben Schöch wird hier ein Post-Doc aus diesem Bereich arbeiten. Weiterhin besteht die Gruppe aus zwei Romanistik-Doktorandinnen sowie einem Romanistik-Doktorand, einem Informatik-Doktorand und mehreren Hilfskräften. "Der interdisziplinäre Aufbau ist eine der Besonderheiten der Gruppe. Es ist wichtig dafür zu sorgen, dass eben nicht die Informatik oder aber die Romanistik hier das Heft alleine in die Hand nehmen", sagt der 37 Jahre alte Computerphilologe, der 2008 promovierte.

    "Es ist eine zentrale Aufgabe der Digital Humanities, den Austausch zwischen den Disziplinen herzustellen", sagt Schöch. Im Alltag ist das nicht immer ganz einfach, wie der Forscher aus Erfahrung berichten kann. Die Arbeitsweisen der Philologen und der Informatiker seien nun einmal verschieden. Aber genau in diesem Punkt sieht der Romanist auch die Chance solcher Projekte: "Wir ergänzen uns gegenseitig, gehen methodisch aufeinander zu und lernen enorm viel voneinander", sagt Schöch.

    Die Arbeitsgruppe bildet eine Schnittstelle zwischen französischer und spanischer Literaturwissenschaft auf der einen und Text Mining und Maschinellem Lernen auf der anderen Seite. "Wir wollen dazu beitragen, dass zeitgemäße computergestützte Methoden für neue Anwendungsbereiche adaptiert und im Methodenrepertoire der romanistischen Literaturwissenschaften verankert werden", erklärt Schöch.

    Kontakt

    Dr. Christof Schöch
    Lehrstuhl für Computerphilologie
    E-Mail: christof.schoech@uni-wuerzburg.de

    Weiterführende Links:

    Website des CLiGS-Projektes: http://clgs.hypotheses.org/

    Projektbeschreibung auf der Webseite der Uni Würzburg:
    http://www.germanistik.uni-wuerzburg.de/lehrstuehle/computerphilologie/forschung/cligs/

    Informationen zu Christof Schöch auf der Webseite der Uni Würzburg: http://www.germanistik.uni-wuerzburg.de/lehrstuehle/computerphilologie/mitarbeiter/schoech/

    Weitere Bilder

    Von Marco Bosch

    Zurück