Fontane-Archiv / 115 [135

134 Fontane Blätter 115 Dossier: Fontanes Fragmente. Fortsetzung langen Fragmente. Zugleich aber zeigt die Grafik, besonders im oberen Cluster, dass ›unvollendete‹ und ›vollendete‹ Texte, mithin unpublizierte Fragmente und publizierte Werke, aus der analytischen Sicht des stilometrischen Algorithmus unterscheidbare Gruppen sind. 3. Phänomene des ›Unvollendeten‹ und des ›Vollendeten‹ Während die Analysen in Abschnitt 2 gezeigt haben, dass die algorithmische Methode der Stilometrie Eigenschaften der Texte beobachtet, anhand derer sich eine Unterscheidung zwischen unpublizierten Fragmenten und publizierten Prosa-Werken vornehmen lässt, wollen wir im Folgenden versuchen, herauszufinden, welche textuellen Eigenschaften die Grundlage für diese Unterscheidung bilden könnten. Beobachten können wir dabei in einem ersten, eine kontrastive Analyse durchführenden Schritt(Abschnitt 3.1) signifikante Differenzen in den häufig verwendeten Token(i. d. R. Wörter). Aufgrund dieser Beobachtung bilden wir dann Thesen für eine vergleichende Betrachtung der beiden Korpora, bei der wir dezidiert auch die Häufigkeit grammatikalischer Eigenschaften analysieren(Abschnitt 3.2). 3.1 Kontrastive Analyse: publizierte fiktionale Prosa-Werke vs. Fragmente Da sich zeigte, dass sich die beiden in Abb. 4 differenzierten Gruppen selbst noch einmal ausdifferenzieren in fiktionale und faktuale Texte, konzentrieren wir uns im Folgenden allein auf fiktionale Texte(also auf 7 fiktionale publizierte Prosa-Werke als das eine Korpus und auf 23 fiktionale Fragmente als das andere Korpus, siehe Anhang). Dabei unterziehen wir nun die beiden Korpora einer kontrastiven Analyse, bei der mittels des sog.»Craig‘s Zeta«-Tests 16 diejenigen Wörter identifiziert werden, die beim Vergleich zweier Korpora in dem einen Korpus überrepräsentiert bzw. unterrepräsentiert sind. Auch die folgende Analyse führen wir mittels des Softwarepakets stylo durch. 17 Das Ergebnis wird in diesem Fall in einer Grafik dargestellt (siehe Abb. 5), bei der links die Token(meist Wörter) stehen, die im Fragmente-Korpus im Vergleich mit dem publizierten Werke-Korpus unterrepräsentiert sind, und rechts die Token(meist Wörter), die im Fragmente-Korpus vergleichsweise überrepräsentiert sind. Ganz oben in der Grafik stehen dabei stets die Token(meist Wörter), für die dies am stärksten gilt; nach unten nimmt der Grad der Über- bzw. Unterrepräsentativität jeweils ab. In Tabelle 1 führen wir die Token auch noch einmal listenförmig auf, wobei wir uns hier, wie in der Grafik, auf die obersten 70 Token beschränken.

Digitales Brandenburg

Digitales Brandenburg