Zwischen»Weltverbesserungsleidenschaft« und»Schmetterlingsschlacht« 103 Die auf diese Weise extrahierten Substantive wurden in einem zweiten Schritt lemmatisiert, das heißt auf ihre Grundform zurückgeführt. Der Plural ›Häuser‹ wurde entsprechend auf den Singular ›Haus‹ zurückgeführt, der Genitiv ›Hauses‹ wurde auf den Nominativ ›Haus‹ zurückgeführt. Auf diese Weise konnte garantiert werden, dass es sich wirklich um ein nur einmal verwendetes Wort und nicht etwa nur um eine einmalig verwendete Flexionsform eines Wortes handelt. Als Ergebnis dieser vorbereitenden Schritte(›Preprocessing‹) lag eine Liste mit allen von Fontane in seinen Romanen verwendeten Substantiven in ihrer jeweiligen Grundform vor. Diese Liste wurde im nächsten Schritt ausgezählt, was eine Rangliste ergab, in der für jedes lemmatisierte Substantiv in Fontanes Romanwerk die Anzahl seiner Vorkommnisse angegeben war. Die ersten Einträge – in diesem Fall wurden die ersten 20 gewählt – dieser Rangliste(Tab. 1) zeigen die häufigsten Substantive in Fontanes Romanwerk, die hier zur Veranschaulichung angeführt seien. Zum Vergleich präsentieren wir zudem die nach exakt der gleichen Methode erhobenen zwanzig häufigsten Substantive in den Wanderungen, einschließlich der Fünf Schlösser(Tab. 2). 3 Tab. 1: Die 20 häufigsten Substantive in Fontanes Romanwerk(Gesamtzahl der Substantive: 179.657) Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Substantiv Frau Tag Herr Wort Haus Hand Zeit Kind Stunde Augenblick Jahr Gott Herz Mann Leben Auge Mutter Seite Welt Weg Anzahl 2.235 1.824 1.719 1.315 1.243 1.227 1.017 895 843 826 818 787 735 722 694 646 636 621 591 590 Prozentualer Anteil 1,24 1,02 0,96 0,73 0,69 0,68 0,57 0,50 0,47 0,46 0,46 0,44 0,41 0,40 0,39 0,36 0,35 0,35 0,33 0,33
Heft
(2018) 106
Seite
103
Einzelbild herunterladen
verfügbare Breiten