Heft 
(2018) 106
Seite
137
Einzelbild herunterladen

Fontanes ›Force‹ und die Figurensprache in Effi Briest 137 Die extrahierten Merkmale wurden verwendet, um mit einem maschinellen Lernverfahren ein Modell zur Zuordnung von Sprechakten zu Sprechern zu erzeugen. Dieses Modell wird dann in einem Algorithmus verwendet, um beliebige Sprechakte der Figur zuzuweisen, die den jeweiligen getätigt hat. Nach Analyse der Sprechakte im Text identifiziert das Modell also wahr­scheinliche Sprecher für Sprechakte, ohne die ›echten Sprecher‹ zu kennen. Da wir diese jedoch ausgehend vom Text bestimmen können, können wir feststellen, wie hoch der Anteil der korrekt erkannten Sprecher ist. Um nun die Wichtigkeit der Merkmale einzuschätzen, entfernen wir schrittweise einzelne Merkmale aus den Daten und vergleichen die Qualität der Spreche­ridentifikation vor und nach der Entfernung. Dem Verfahren werden zunächst die folgenden Merkmale zugeführt: Wortzahlenstatistiken: durchschnittliche Anzahl von Wörtern, ­Sätzen, Buchstaben und Satzzeichen Anzahl Wortarten: Anzahl der Vorkommen von Wortarten 7 Anzahl Phrasen: Anzahl von Nominalphrasen, Verbalphrasen, ­Adjektivphrasen, Adverbialphrasen und Präpositionalphrasen 8 Perspektive: Anzahl der Erwähnungen von»ich«,»sie« und von ­Eigennamen Sentiment: Ist ein Sprechakt negativ oder positiv, subjektiv oder ob­jektiv(verwendete Methode ist Textblobs Sentimentexktraktion 9 )? Emotion: Relativer Anteil von Wörtern aus einem Emotionswörter­buch für Ekel, Freude, Furcht, Trauer, Überraschung, Verachtung, und Wut 10 Hochfrequente Wörter: Der relative Anteil der zehn meistgebrauch­ten Wörter in den Sprechakten aller Figuren(ja, immer, frau, schon, ganz, effi, gut, wohl, muß, sagen), wobei Funktionswörter(Präposi­tionen etc.) nicht berücksichtigt werden 2. Figurensprache im Kontrast Die Wichtigkeit einzelner Merkmale kann visuell mithilfe von Balkendia­grammen dargestellt werden, wie in Abb. 1–3 veranschaulicht. Auch wenn das Verfahren grundsätzlich auch den Vergleich mehrerer Figuren mitein­ander erlaubt, fokussieren wir uns auf den paarweisen Vergleich der Figu­ren. Die Abbildung 1 zeigt die Merkmale, die für den Unterschied der Rede­parts von Effi und Innstetten besonders wichtig sind. Aus der Abbildung lässt sich folglich nichts über die Figuren als solche herauslesen, sondern nur im Vergleich mit der jeweils anderen Figur. Im Vergleich von Effi und Innstetten erweisen sich die Merkmale ITJ, FM und»effi« als ausschlaggebend. Bei diesen Merkmalen handelt es sich um Wörter der Wortarten Interjektion und Fremdwort sowie