Heft 
(2018) 106
Seite
140
Einzelbild herunterladen

140 Fontane Blätter 106 Labor der Wortarten handelt, der wiederum von einem Tokenisierungsfehler ­ausgelöst wird, also einem Fehler bei der Identifikation von distinkten Zei­chenfolgen(Tokens), vor allem von Wörtern: Die Zeichenfolge»›Gott« sollte eigentlich in zwei Zeichen(folgen), nämlich»» und»Gott«, aufgeteilt wer­den, was nicht geschehen ist. Dieses Beispiel illustriert, wie durch eine re­flektierte Überprüfung quantitativer Ergebnisse eine Fehl- oder Überinter­pretation vermieden werden kann. 3. Fazit Wir verzichten an dieser Stelle bewusst auf eine(literaturwissenschaft­liche) Deutung der Ergebnisse, auch wenn einige der Ergebnisse gewisse Ansatzpunkte bieten würden. Denn im Sinne einer reflektierten Textanaly­se müsste vor einer Deutung ein Validierungsschritt erfolgen, etwa um zu ­verifizieren, ob die zugrundeliegenden Analysewerkzeuge(wie z.B. die Er­kenner für Wortarten) zufriedenstellende Ergebnisse liefern. Selbst bei ei­ner sehr hohen Falsifikationsrate ist mit einem gewissen Fehleranteil zu rechnen, wie am Beispiel von Innstettens Vorliebe(oder auch nicht Vorlie­be) für Modalverben im Partizip Perfekt veranschaulicht werden konnte. Wie eine valide Interpretation auf dieser Basis geleistet werden kann, ist aus unserer Sicht eine offene methodische Frage. Nichtsdestotrotz eröffnet die Extraktion linguistischer Merkmale neue Perspektiven: Die Aufmerksamkeit kann im close reading gezielt auf die oben angeführten sprachlichen Merkmale der Figuren gelenkt werden, etwa auf Innstettens Gebrauch von Interjektionen oder auf Effis Abnei­gung gegenüber Fremdwörtern. In der tiefergehenden Analyse ließen sich die Ausschläge des Systems nicht nur überprüfen, sondern bei Überein­stimmung auch für eine quantitativ gestützte Charakterisierung der Figu­ren heranziehen.