Heft 
(2023) 115
Seite
134
Einzelbild herunterladen

134 Fontane Blätter 115 Dossier: Fontanes Fragmente. Fortsetzung l­angen Fragmente. Zugleich aber zeigt die Grafik, besonders im oberen Cluster, dass ›unvollendete‹ und ›vollendete‹ Texte, mithin unpublizierte Fragmente und publizierte Werke, aus der analytischen Sicht des stilometri­schen Algorithmus unterscheidbare Gruppen sind. 3. Phänomene des ›Unvollendeten‹ und des ›Vollendeten‹ Während die Analysen in Abschnitt 2 gezeigt haben, dass die algorithmi­sche Methode der Stilometrie Eigenschaften der Texte beobachtet, anhand derer sich eine Unterscheidung zwischen unpublizierten Fragmenten und publizierten Prosa-Werken vornehmen lässt, wollen wir im Folgenden ver­suchen, herauszufinden, welche textuellen Eigenschaften die Grundlage für diese Unterscheidung bilden könnten. Beobachten können wir dabei in ei­nem ersten, eine kontrastive Analyse durchführenden Schritt(Abschnitt 3.1) signifikante Differenzen in den häufig verwendeten Token(i. d. R. Wör­ter). Aufgrund dieser Beobachtung bilden wir dann Thesen für eine verglei­chende Betrachtung der beiden Korpora, bei der wir dezidiert auch die Häufigkeit grammatikalischer Eigenschaften analysieren(Abschnitt 3.2). 3.1 Kontrastive Analyse: publizierte fiktionale Prosa-Werke vs. Fragmente Da sich zeigte, dass sich die beiden in Abb. 4 differenzierten Gruppen selbst noch einmal ausdifferenzieren in fiktionale und faktuale Texte, konzentrie­ren wir uns im Folgenden allein auf fiktionale Texte(also auf 7 fiktionale publizierte Prosa-Werke als das eine Korpus und auf 23 fiktionale Fragmen­te als das andere Korpus, siehe Anhang). Dabei unterziehen wir nun die bei­den Korpora einer kontrastiven Analyse, bei der mittels des sog.»Craigs Zeta«-Tests 16 diejenigen Wörter identifiziert werden, die beim Vergleich zweier Korpora in dem einen Korpus überrepräsentiert bzw. unterrepräsen­tiert sind. Auch die folgende Analyse führen wir mittels des Softwarepakets stylo durch. 17 Das Ergebnis wird in diesem Fall in einer Grafik dargestellt (siehe Abb. 5), bei der links die Token(meist Wörter) stehen, die im Fragmen­te-Korpus im Vergleich mit dem publizierten Werke-Korpus unterrepräsen­tiert sind, und rechts die Token(meist Wörter), die im Fragmente-Korpus vergleichsweise überrepräsentiert sind. Ganz oben in der Grafik stehen da­bei stets die Token(meist Wörter), für die dies am stärksten gilt; nach unten nimmt der Grad der Über- bzw. Unterrepräsentativität jeweils ab. In Tabel­le 1 führen wir die Token auch noch einmal listenförmig auf, wobei wir uns hier, wie in der Grafik, auf die obersten 70 Token beschränken.