Fontane-Archiv / 106 [141

140 Fontane Blätter 106 Labor der Wortarten handelt, der wiederum von einem Tokenisierungsfehler ausgelöst wird, also einem Fehler bei der Identifikation von distinkten Zeichenfolgen(Tokens), vor allem von Wörtern: Die Zeichenfolge»›Gott« sollte eigentlich in zwei Zeichen(folgen), nämlich»›» und»Gott«, aufgeteilt werden, was nicht geschehen ist. Dieses Beispiel illustriert, wie durch eine reflektierte Überprüfung quantitativer Ergebnisse eine Fehl- oder Überinterpretation vermieden werden kann. 3. Fazit Wir verzichten an dieser Stelle bewusst auf eine(literaturwissenschaftliche) Deutung der Ergebnisse, auch wenn einige der Ergebnisse gewisse Ansatzpunkte bieten würden. Denn im Sinne einer reflektierten Textanalyse müsste vor einer Deutung ein Validierungsschritt erfolgen, etwa um zu verifizieren, ob die zugrundeliegenden Analysewerkzeuge(wie z.B. die Erkenner für Wortarten) zufriedenstellende Ergebnisse liefern. Selbst bei einer sehr hohen Falsifikationsrate ist mit einem gewissen Fehleranteil zu rechnen, wie am Beispiel von Innstettens Vorliebe(oder auch nicht Vorliebe) für Modalverben im Partizip Perfekt veranschaulicht werden konnte. Wie eine valide Interpretation auf dieser Basis geleistet werden kann, ist aus unserer Sicht eine offene methodische Frage. Nichtsdestotrotz eröffnet die Extraktion linguistischer Merkmale neue Perspektiven: Die Aufmerksamkeit kann im close reading gezielt auf die oben angeführten sprachlichen Merkmale der Figuren gelenkt werden, etwa auf Innstettens Gebrauch von Interjektionen oder auf Effis Abneigung gegenüber Fremdwörtern. In der tiefergehenden Analyse ließen sich die Ausschläge des Systems nicht nur überprüfen, sondern bei Übereinstimmung auch für eine quantitativ gestützte Charakterisierung der Figuren heranziehen.

Digitales Brandenburg

Digitales Brandenburg