Franz B. Wember
Evaluation in Einzelfallstudien
vorkommt, weil hier zumeist mit bestehenden Gruppen gearbeitet wird, aber auch dann ist die Durchführung eines Forschungsprojektes nicht unproblematisch. Die Methodologie des Guppenvergleiches erfordert nämlich in aller Regel eine feste Zuteilung von Personen zu Gruppen sowie eine fixe Terminierung von Interventions- und Kontrollbedingungen. Eine flexible Anpassung an institutionelle Veränderungen, an die Unwägbarkeiten des Alltags oder an aktuell entstehende Bedürfnisse der Versuchspersonen kann nicht erfolgen, ohne die interne Validität der empirischen Studie zu gefährden. Aus sonderpädagogischer Sicht nachteilig ist vor allem der Umstand, daß eine Intervention nach festem Zeitplan implementiert werden muß und nicht in Abhängigkeit von Erfolg oder Mißerfolg der Lernenden modifiziert werden kann. Dies entspricht ganz und gar nicht der alltäglichen Vorgehensweise. Eine praktisch arbeitende Sonderpädagogin wird, falls ihr Schüler das gesetzte Ziel erreicht hat, eine Intervention beenden und diese nicht überflüssigerweise weiterführen, und sie wird die Intervention länger fortsetzen als geplant, vielleicht sogar intensivieren, wenn mangelnder Lernfortschritt dies nötig macht. Sonderpädagogische Evaluationsforschung brauchte eine flexible Methodologie die erlaubt, Probleme so zu studieren und so zu lösen wie in der Praxis(vgl. Langfeldt 1990, 286).
Ein zweites Praxisproblem bei Gruppenvergleichsstudien ist deren geringe Sensitivität für individuelle Differenzen. Nehmen wir an, ein Programm zur Förderung des Lesens habe im Nachtest statistisch signifikant höhere Werte bei lernbehinderten Kindern erbracht als sie Kinder erzielt haben, die nur traditionell unterrichtet wurden, und nehmen wir weiter an, der Unterschied sei groß genug, um praktisch signifikant zu sein. Können wir daraus schließen, das neue Programm habe allen Kindern geholfen? Viele meinen, diese Frage bejahen zu können, aber White(1984, 76) nennt dies zurecht das geläufige Vorurteil von der Gleichförmigkeit des Interventionseffektes— der Effekt scheint einheitlich zu sein, aber dieser Eindruck resultiert
allein aus der Tatsache, daß nur gruppenbezogene Statistiken wie Mittelwerte oder Streuungsmaße analysiert werden, und diese sind für individuelle Differenzen gewissermaßen blind. Die Erfahrung aus vielen Forschungen zeigt, daß in aller Regel von einer differentiellen Wirksamkeit einer Intervention auszugehen ist, d.h. ein Teil der Experimentalgruppe hat große, ein Teil hat kleine und ein Teil hat keine Lernfortschritte gemacht oder gar Rückschritte erlitten. Solche Differenzen werden in Gruppenstatistiken als Fehlervarianz behandelt und nicht weiter untersucht, aber aus sonderpädagogischer Sicht sind gerade solche differentiellen Interventionseffekte von besonderer Bedeutung: schließlich ist die Sonderpädagogik schon immer eine differentielle Pädagogik gewesen, in der versucht wurde, Interventionen zu individualisieren und den besonderen Erfordernissen des einzelnen anzupassen. White fordert folgerichtig(1984, 77), man solle im Anschluß an Gruppenvergleichsstudien die Subgruppen der erfolgreichen und weniger erfolgreichen Lerner zu identifizieren und hinsichtlich charakterisierender Merkmale zu beschreiben suchen, um in Zukunft faktorielle Designs realisieren zu können, in denen verschiedene, in sich homogenere Teilgruppen der Zielpopulation untersucht werden. Dieser Vorschlag führt schnell zu faktoriellen Designs mit sehr vielen Zellen. Er ist angesichts der bereits diskutierten Stichprobenprobleme in Sondererziehung und Rehabilitation deswegen kaum umzusetzen, zumal er wegen der hohen Inhomogenität von Behindertenpopulationen zu immer weiteren Ausdifferenzierungen und letztendlich dazu führen wird, jede Zelle mit nur einer Person zu besetzen, weil keine zwei Personen wirklich vergleichbar wären— ein Gedanke, den wir weiter unten wieder aufgreifen wollen und der uns zum letzten Kritikpunkt führt, der geringen individuellen Repräsentativität von Gruppenvergleichsergebnissen.
Empirisch ermittelte mittlere Effekte sind, interne Validität vorausgesetzt, Tepräsentativ für vergleichbare Stichproben: sie lassen Aussagen zu über zu
HEILPÄDAGOGISCHE FORSCHUNG Band XX, Heft 3, 1994
künftig zu erwartene mittlere Effekte in Gruppen, aber sie lassen keine Aussagen zu über zu erwartende individuelle Effekte bei Einzelpersonen. Das hängt damit zusammen, daß Interventionen, wie soeben gezeigt, in aller Regel keine uniforme, sondern differentielle Wirksamkeit zeigen, vor allem in inhomogenen Stichproben. Niemand weiß jedoch, welcher Subpopulation ein bestimmtes Individuum, das behandelt werden soll, zuzurechnen ist: Gehört es zu denen, die besonders viel, besonders wenig oder eher durchschnittlich profitieren? Aus sonderpädagogischer Sicht folgen hieraus zwei zentrale Probleme. Erstens ist zu konstatieren, daß individuelle Effekte fast immer deutlich von den in Gruppen berechneten Durchschnittswerten abweichen, so daß die in Gruppenvergleichsstudien ermittelten Ergebnisse von Praktikern nur mit äußerster Vorsicht benutzt werden dürfen. Zweitens besteht die Arbeit der Sonderpädagogen im Kern darin, individuell angepaßte pädagogische Interventionen durchzuführen. Weil die Herangehensweise des Forschers nicht der des Praktikers entspricht, bieten die vergleichsweise undifferenzierten Forschungsergebnisse nicht die Orientierung, die in der Praxis gebraucht wird. Hier wüßte man gerne, wer von welcher Intervention unter welchen Bedingungen in welchem individuellem Ausmaß profitiert. Wir werden im folgenden eine neue Forschungsstrategie vorstellen, die zwar nicht alle in diesem und im vorangegangenen Abschnitt angesprochenen Probleme zu 1ösen vermag, die in ihrer Vorgehensweise jedoch der praktischen sonderpädagogischen Arbeit eher entspricht als die traditionelle Strategie des Gruppenvergleichs.
Einzelfallanalysen als Alternativen
Nicht zuletzt die weiter oben angesprochenen Realisierungsprobleme haben dazu geführt, daß die in Abbildung 3 aufgeführten gruppenvergleichenden Designs in der pädagogischen Evaluationsforschung vergleichsweise selten an
107