Heft 
(2023) 115
Seite
127
Einzelbild herunterladen

Vermessung des ›Unvollendeten‹  Sluyter-Gäthje, Skorinkin, Trilcke 127 Zum anderen ist es denkbar, dass die Fragmente noch etwas aufweisen, was aus ihnen im Zuge ihrer Vollendung entfernt worden wäre, etwa komposito­rische Hilfskonstruktionen oder erzählreflexive Meta-Kommentare. In die­sem Fall wären in den Fragmenten noch Phänomene des Unvollendeten ent­halten. In der folgenden Serie von Experimenten wollen wir gestützt auf algorith­mische Methoden der Computational Literary Studies nach der Abwesenheit von Phänomenen des Vollendeten und nach der Anwesenheit von Phänomenen des Unvollendeten in Fontanes Fragmenten fragen. Unsere Vorgehensweise ist dabei nicht absolut(wir setzen also nicht voraus, dass wir wissen, was Phä­nomene des Unvollendeten resp. des Vollendeten sind), sondern genuin relati­onal. In diesem Sinne werden wir die Fragmente durchgängig vergleichend in Bezug zu publizierten Prosa-Werken Fontanes analysieren, dies mit dem Ziel, herauszufinden, was Erstere von Letzteren unterscheidet. In einer ersten Reihe von Experimenten(Abschnitt 2) werden wir zu­nächst zeigen, dass sich mit der von uns gewählten Methode der Stilometrie (die, kurz gesagt, auf dem Vergleich von Worthäufigkeiten basiert) tatsäch­lich wenn auch mit gewissen Einschränkungen klassifikatorische Unter­schiede zwischen Fragmenten und publizierten Prosa-Werken Fontanes feststellen lassen. Daraufhin werden wir(Abschnitt 3) eine Reihe von Unter­suchungen durchführen, in denen wir danach fragen, welche textuellen Phänomene als Grundlage einer algorithmischen Unterscheidung zwischen Fragmenten und publizierten Prosa-Werken dienen können. 2. Automatisiertes Clustering des Unvollendeten 2.1 Die Funktionsweise des stilometrischen Algorithmus Bei der von uns im Folgenden verwendeten Methode der Stilometrie, wie sie etwa in der Software stylo verfügbar ist, 7 handelt es sich in erster Linie um ein Verfahren des Clustering, also der Gruppierung von Elementen(hier: Texte) auf Basis von Ähnlichkeit. Für jeden Text wird dabei zunächst eine Liste der häufigsten Token erstellt, wobei ein Token in der Regel ein Wort­vorkommnis ist. Diese Listen werden daraufhin mittels eines Ähnlichkeits­maßes(›Burrows Delta‹) miteinander verglichen. Ein weiterer Algorithmus differenziert anschließend die Texte auf Basis der Ähnlichkeit bzw. Unähn­lichkeit der Listen in distinkte Gruppen. Stilometrische Verfahren wurden zunächst v. a. im Feld der Autorschaftsattribution eingesetzt, aber auch Tex­te unterschiedlicher Gattungen können auf diese Weise bemerkenswert ein­deutig unterschieden werden. Um das Verfahren einzuführen, zeigen wir das Ergebnis einer von uns durchgeführten exemplarischen Studie auf der Basis der insgesamt 500 häufigsten Wörter von insgesamt 48 Texten. Das