168 Theodor Ehlers
der Erwachsenenform(vgl. Davreux 1969, Bjerstedt 1965) Anlaß zu einer eher skeptischen Beurteilung des Verfahrens.
1.4.2. Der methodische Aspekt. Ein Teil der Ergebnislosigkeit der Untersuchungen könnte auf ungeeignete Gültigkeitskriterien zurückgeführt werden. So ist der häufig vorhergesagte, aber nie nachweisbare Geschlechterunterschied wohl kaum als„theoretisch bedeutsames Kriterium“(Keil-Specht u. Denzer 1971, S. 192) anzusehen. Denn tatsächlich fanden sich reale, durchgängige Verhaltensunterschiede zwischen den Geschlechtern nur im Bereich der körperlichen Aggressionen. Hinsichtlich der auch durch die P-F S aktualisierten verbalen Aggressionen zeigten Verhaltensbeschreibungen dagegen z. T. keine Geschlechterunterschiede(Maccoby 1966, Bandura, Ross u. Ross 1961, McIntyre 1972). Feshbach u. Feshbach(1972) fanden die stärkeren verbalen Aggressionen auf seiten der Mädchen. Nur Sears, Rau u. Alpert (1965) berichten von sowohl größerer körperlicher als auch verbaler Aggression der Jungen im Vergleich zu den Mädchen während des freien Spiels. Feshbach(1970) vertritt die Annahme, daß Unterschiede zwischen den Geschlechtern weniger in Bezug auf die Antriebe zu aggressiven Handlungen als vielmehr in der Art der(gesellschaftlich tolerierten) Ausdrucksmöglichkeiten bestehen. Nach diesen Befunden und Überlegungen wären Geschlechterunterschiede in der P-F S gar nicht so naheliegend.
Als ungeeignetes Kriterium für erhöhte Aggressivität ist auch das Merkmal„Delinquenz‘“ anzusehen, insoweit es nicht auf Delikte bezogen wird, denen aggressives Verhalten zugrunde liegt. Das war z.B. in den Untersuchungen von Lindsey u. Goldwyn und Norman u. Kleinfeld nicht der Fall.
Ein weiterer Teil der Ergebnislosigkeit der P-F S-Untersuchungen könnte mit Stichprobenproblemen zusammenhängen. So mußte bei Gegenüberstellung der Ergebnisse von Versuchsgruppen und den entsprechenden Normwerten(z.B. Weise 1971, Johannsen u. Bennett 1955) Vergleichbarkeit vorausgesetzt werden, weil neben dem Alter nichts über die Repräsentativität der Eichstichproben bekannt ist. Die benutzten Normwerte stützen sich darüber hinaus auf kleine Stichproben, die deutschen z.B. auf 80 Kinder pro Altersgruppe. Bei eigentlichen Gruppenvergleichen wurden in der Delinquentenuntersuchung von Lindsey und Goldwyn Kontrollgruppen verwendet, deren P-F S-Werte sich deutlich von denen der Eichstichprobe unterscheiden (vgl. Levitt u. Lyle 1955). In der Untersuchung von Lipman mit geistig Retardierten muß angenommen werden, daß die Probanden den Test unter anderer Voraussetzung bearbeitet haben als der Durchschnittsproband.
Auch die Bedingungen der Testdurchführung könnten die Vergleichbarkeit der Untersuchungsergebnisse in Frage stellen. So wurde die Antwortregistrierung manchmal von den Probanden, manchmal vom Testleiter selbst vorgenommen. Nach Mirmow(1952) wird durch die letztgenannte Bedingung der Anteil der extrapunitiven Antworten erheblich vermindert. Simons (1967a) stellte allerdings keine Medianunterschiede fest zwischen den durch die Testleiter bei seiner Stichprobe von 714 Kindern registrierten Antworten und der deutschen Eichstichprobe. Eine Untersuchung von Zuk(1956) erbrachte Anhaltspunkte dafür, daß Kinder im Rahmen einer wenig eingeschränkten sozialen Atmosphäre(Ferienlager) stärker extrapunitiv reagieren