Fontanes ›Force‹ und die Figurensprache in Effi Briest 137 Die extrahierten Merkmale wurden verwendet, um mit einem maschinellen Lernverfahren ein Modell zur Zuordnung von Sprechakten zu Sprechern zu erzeugen. Dieses Modell wird dann in einem Algorithmus verwendet, um beliebige Sprechakte der Figur zuzuweisen, die den jeweiligen getätigt hat. Nach Analyse der Sprechakte im Text identifiziert das Modell also wahrscheinliche Sprecher für Sprechakte, ohne die ›echten Sprecher‹ zu kennen. Da wir diese jedoch ausgehend vom Text bestimmen können, können wir feststellen, wie hoch der Anteil der korrekt erkannten Sprecher ist. Um nun die Wichtigkeit der Merkmale einzuschätzen, entfernen wir schrittweise einzelne Merkmale aus den Daten und vergleichen die Qualität der Sprecheridentifikation vor und nach der Entfernung. Dem Verfahren werden zunächst die folgenden Merkmale zugeführt: • Wortzahlenstatistiken: durchschnittliche Anzahl von Wörtern, Sätzen, Buchstaben und Satzzeichen • Anzahl Wortarten: Anzahl der Vorkommen von Wortarten 7 • Anzahl Phrasen: Anzahl von Nominalphrasen, Verbalphrasen, Adjektivphrasen, Adverbialphrasen und Präpositionalphrasen 8 • Perspektive: Anzahl der Erwähnungen von»ich«,»sie« und von Eigennamen • Sentiment: Ist ein Sprechakt negativ oder positiv, subjektiv oder objektiv(verwendete Methode ist Textblobs Sentimentexktraktion 9 )? • Emotion: Relativer Anteil von Wörtern aus einem Emotionswörterbuch für Ekel, Freude, Furcht, Trauer, Überraschung, Verachtung, und Wut 10 • Hochfrequente Wörter: Der relative Anteil der zehn meistgebrauchten Wörter in den Sprechakten aller Figuren(ja, immer, frau, schon, ganz, effi, gut, wohl, muß, sagen), wobei Funktionswörter(Präpositionen etc.) nicht berücksichtigt werden 2. Figurensprache im Kontrast Die Wichtigkeit einzelner Merkmale kann visuell mithilfe von Balkendiagrammen dargestellt werden, wie in Abb. 1–3 veranschaulicht. Auch wenn das Verfahren grundsätzlich auch den Vergleich mehrerer Figuren miteinander erlaubt, fokussieren wir uns auf den paarweisen Vergleich der Figuren. Die Abbildung 1 zeigt die Merkmale, die für den Unterschied der Redeparts von Effi und Innstetten besonders wichtig sind. Aus der Abbildung lässt sich folglich nichts über die Figuren als solche herauslesen, sondern nur im Vergleich mit der jeweils anderen Figur. Im Vergleich von Effi und Innstetten erweisen sich die Merkmale ITJ, FM und»effi« als ausschlaggebend. Bei diesen Merkmalen handelt es sich um Wörter der Wortarten Interjektion und Fremdwort sowie
Heft
(2018) 106
Seite
137
Einzelbild herunterladen
verfügbare Breiten