zienten berechnet(vgl. Glass 1981). Dabei ergibt sich eine hochsignifikante, negative Korrelation zwischen ef3 und der Anzahl der Generalisationssettings(r=‚594, p=0.006). Dies bedeutet, daß bei steigender Anzahl von Generalisationssettings der Abfall von Trainings- zu Generalisationsleistung abnimmt. Die Anzahl der Generalisationssettings, Setting-Unterschiede, Vortest der Generalisationssettings, Unterschied Trainer-Beobachter, Trainingsstrategie und Länge des Treatments haben keinen weiteren signifikanten Einfluß auf die drei EffektStärken.
Darüber hinaus werden auch Analysen zwischen Variablen der Versuchspersonen(Alter und Intelligenzquotient) und den drei Effekt-Stärken gerechnet. Diese Analyse bringt ein überraschendes Ergebnis. Die Effekt-Stärke 3, die sich aus dem Unterschied zwischen Trainingsund Generalisationsergebnis berechnet, korreliert positiv signifikant mit dem Intelligenzquotienten der Versuchspersonen(r=0.5532, p=0.011). Das bedeutet, daß bei höherem IQ der Leistungsabfall von Trainings- auf Generalisationssituationen zunimmt.
Diskussion a) Methodische Probleme
Die Berechnung von Effekt-Stärken nach Gingerich(1984), White und Kollegen (1989) baut auf die Annahme auf, daß jeder einzelne Datenpunkt so aufgefaßt werden könnte, als würde es sich dabei um verschiedene Versuchspersonen handeln. Voraussetzung für eine sichere Berechnung der Effekt-Stärke ist daher, daß eine genügend große Anzahl von Beobachtungen vorliegt.
In vielen Primärstudien wird aber nur eine sehr geringe Anzahl von Beobachtungsdaten berichtet. Dies gilt vor allem für die Baselinephase. Dadurch ist es kaum möglich, für Studien, die ein Multiple-Baseline-Design verwenden, getrennte Effekt-Stärken für die einzelnen Baselines bzw. Versuchspersonen zu berechnen.
Wolfgang Plaute+ Lebenspraktische Fertigkeiten bei Geistig- und Mehrfachbehinderten
Ein weiteres Problem, das sich aus diesem Zusammenhang ergibt, ist die geringe Varianz bei so wenigen, oft gleichen Daten. Daraus resultieren auch hohe Varianzunterschiede zwischen den einzelnen Effekt-Stärken. Manche Studien weisen kaum Varianz auf, und andere Studien haben sehr hohe Varianz. Eine Clusteranalyse der 32 Primärstudien bezüglich der Effekt-Stärke 1 erbrachte sieben(!) verschiedene Cluster. So besteht der größte Cluster nur mehr aus sieben Primärstudien, ist aber immernoch nicht homogen bezüglich der Varianz. In diesem Zusammenhang stellt sich überhaupt die Frage nach der Möglichkeit von homogener Varianz bei einer so heterogenen Gruppe, wie sie die geistig behinderten Menschen darstellen(Diskussion siehe unten).
Die Zusammenfassung von verschiedenen Baselinedaten wird zwar als geeignete Alternative dargestellt(vgl. White et al. 1989), birgt aber gewisse inhaltliche Schwierigkeiten und löst diese Probleme nur dann, wenn dadurch genügend Meßpunkte zusammengefaßt werden können. Außerdem können somit die einzelnen Baselines nicht getrennt ausgewertet werden bzw. müssen verschiedene Versuchspersonen zusammengefaßt werden, wodurch nicht für jede Versuchsperson Effekt-Stärken berechnet werden können. Um Einzelfallstudien besser integrieren zu können, ist es daher unbedingt notwendig, daß in den Primärstudien mehr Daten erhoben und berichtet werden. So beschreiben White und Kollegen(1989) in ihrem Artikel zur Analyse von Einzelfallstudien ein Beispiel anhand von zwei Versuchspersonen mit 23 bzw. 29 Baseline- und 24 bzw. 18 Trainings-Daten. In den vorliegenden Primärstudien wurden für die meisten Versuchspersonen ein bis vier Daten in der Baseline und ein bis fünf Daten für Trainings- bzw. Generalisationsleistung erhoben.
b) Das Problem der” Homogenität” in der Gruppe der geistig behinderten Menschen!
Bei Literaturanalysen zum Thema”geistige Behinderung” stößt man auf eine
HEILPÄDAGOGISCHE FORSCHUNG Band XVII, Heft 1, 1992
Unmenge von Studien. In den meisten Untersuchungen wird geistige Behinderung über den Intelligenzquotienten definiert. Trotz der Mängel der Intelligenzmessung und dem Wissen um die Bedeutung von anderen Variablen(u.a. Verhaltensparameter, Art der Behinderung, sozialisationseffekte, Alter, Hospitalisierungseffekte...) dient meist einzig der IQ zur Kategorisierung von leichter, mittlerer und schwerer geistiger Behinderung. Zusätzlich werden zur Messung von Intelligenz verschiedene Verfahren eingesetzt, die wiederum unterschiedliche, inhaltliche Schwerpunkte setzen. Es kann daher nicht verwundern, daß Intelligenzmessung nicht dafür geeignet ist, eine homogene Gruppe von Menschen zu beschreiben. Zuviele andere Faktoren spielen(auch bei lebenspraktischen Fertigkeiten) eine wichtigeRolle. Dies stimmt umso mehr nachdenklich, als bei geistig behinderten Menschen in vielen Fällen ausführliche AnamneseDaten vorliegen würden, die eine Kategorisierung auf eine weitaus breitere Basis stellen würde. Dies könnte gerade in Einzelfall-Designs berücksichtigt werden. Nicht die Bezeichnung”geistig behindert”, sondern eine detaillierte Beschreibung der Person würde es ermöglichen, relativ homogene Gruppen innerhalb der(Nicht)- Gruppe”geistig behinderter Menschen” zu identifizieren. Theorien, Modelle und praktische Anwendungen könnten somit sehr viel spezifischer erstellt und evaluiert werden.
c) Was bedeuten derartig hohe Effekt-Stärken?
Wie bereits oben angesprochen, erreichen Studien in den Sozialwissenschaften normalerweise Effekt-Stärken zwischen 0.3 und 0.5. Die Primärstudien in dieser Untersuchung erreichen Effekt-Stärken zwischen 0.52 und 15.02(!) mit einem Mittelwert von 5.28. Diese enormen Effekt-Stärken sollen zunächst anhand der Berechnungsformel erklärt werden.
Die Formel lautet:
d=(X,-X)/SDoye
Für die einzelnen Werte aus den Primärstudien gilt nun:
39