keit zu den übrigen Items des Tests. Mögliche Ursachen für diese Abweichungen werden in der Diskussion besprochen. Die Interkorrelationen(1-Koeffizienten) zwischen den Testitems wurden weiterhin einer nichtmetrischen multidimensionalen Skalierung(Smallest Space Analyse, Programm SSA-I; Lingoes 1973) unterzogen. Die 2-dimensionale Repräsentation der Ähnlichkeitsbeziehungen zwischen den Items ist in Abbildung 4 durch die jeweilige Lage im Raum veranschaulicht. Die Kontrollaufgaben gruppieren sich eng im Zentrum zusammen. In der Peripherie finden sich die Aufgaben der drei Trainingsphasen. Diese sind allerdings für die einzelnen Untertests nur teilweise getrennt. Insbesondere ist die erste Trainingsaufgabe von Untertest II von dennoch nachfolgenden Trainingsaufgaben deutlich abgerückt. Wie schon in der Clusteranalyse zeigt dies an, daß diese Aufgabe(2.1) besondere Anforderungen stellte.
Analyse der Konsistenz
Als nächstes überprüften wir, inwieweit die einzelnen Aufgaben des Tests die analysierten Schüler(n=115) hinsichtlich der jeweils benötigten Hilfen in gleicher Weise abstufen. Die Ergebnisse der Konsistenzanalyse sind in Tabelle 7 mitgeteilt. Gemessen an der geringen Zahl von nur 15 Items sind die Koeffizienten zufriedenstellend hoch, insbesondere wenn man jeden Untertest hypothetisch auf 15 Items aufwertet.
Schließlich fragten wir uns, inwieweit der Hilfenverbrauch wiedergibt, ob durch den Test eine homogene Fähigkeit erfaßt wird. Dazu führten wir für die Trainingsund Kontrollaufgaben getrennt eine Analyse nach dem Partial Credit-Modell von Masters(1982) durch. In diesem Modell wird eine latente Fähigkeitsdimension angenommen. Für diese werden pro Item sogenannte Schwellenparameter(Rost 1988) oder“Item step values”(Masters 1982) berechnet. Dies sind Stellen auf dem latenten Fähigkeitskontinuum, an denen die Wahrscheinlichkeit für den jeweils nächst höheren Hilfenwert gröBer ist als die Wahrscheinlichkeit des
Jürgen Guthke, Petra Wolschke, Klaus Willmes& Walter Huber* Leipziger Lerntest
Tab. 7: Alpha-Koeffizienten nach Cronbach (n’=115)
Testteile a-Koeffizienten Alle 15 Items ‚736
9 Trainingsitems ‚619„730* 6 Kontrollitems ‚636 ‚814* Untertest I ‚450„J11* Untertest II ‚529„zx1* Untertest III ‚656 ‚851*
* aufgewertet für 15 Items, Spearman-Brown Vorhersageformel(vgl. Lienert 1969)
unmittelbar vorangehenden Hilfenwertes.
Das Resultat dieser Analyse mit dem Programm CREDIT(Masters, Wright& Ludlow 1982) ist in Abbildung 5 wiedergegeben. In der Horizontalen ist jeweils die latente Fähigkeitsdimension von hoch bis niedrig abgetragen. Hinsichtlich dieser Fähigkeitsdimension sind dann für jedes der neun Trainingsitems bzw. der sechs Kontrollitems die Schwellenwerte angegeben, von denen an die Hilfen der Stufe 1, 2 und 3 die relativ höchste Wahrscheinlichkeit besitzen. Links von 1 liegt der Bereich höchster Fähigkeit, d.h. Hilfenwert 0. Die einzelnen Aufgaben sind von oben nach unten so sortiert, daß der Schwellenwert für die Hilfenstufe 3 immer weiter nach links verschoben ist, d.h. die Aufgaben erfordern immer häufiger die höchste Hilfenstufe.
Die erste Trainingsaufgabe des zweiten Untertests zeigt wiederum eine Sonderstellung: Nur bei hoher latenter Fähigkeit kann dieses Item ohne jede Hilfe gelöst werden. Die Hilfenstufe 1 hat etwa denselben Schwellenwert wie entsprechende Hilfen bei den Trainingsaufgaben im schwersten Untertest II. Weiterhin fällt auf, daß es bei den Trainingsaufgaben 1 und 2 des dritten Untertests keinen Bereich gab, in dem Hilfen bis zur Stufe 2 höchste Wahrscheinlichkeit haben. Bei diesen beiden Aufgaben führten Hilfen bis zur Stufe 2 nur selten zu richtigen Lösungen. In der rechten Kolumne der Abbildung sind Werte für die Anpassungsgüte der Items an das Testmodell angegeben. Alle Werte sind dem Betrag nach deutlich kleiner als 2.0, d.h. es liegt zufriedenstellende Anpassung an das Modell vor. Damit ist gezeigt, daß die
HEILPÄDAGOGISCHE FORSCHUNG Band XVII, Heft 4, 1992
Trainingsaufgaben(n’=155) ten fit
UT 1.2 1 2 3 1.0 UT 1.1 12 3 0.3 UT 2.1 1 2 3 1.4 UT 1.3 12 3 0.1 UT 2.2 1 2 3„0.5 UT 2.3 12 3 0.1 UT 3.1 1 3-0.,7
UT 3.2 1 3 0.2 UT 3.3 1 2 3„1.2 HH———— Hohe+2 1 0 1 2 Niedrige Fähigkeit
Fähigkeit Item Kontrollaufgaben(n’’=56) Item fit UT 1.5 1 3 1.7 UT 1.4 12 3 1.0 UT 2.5 3-0.5 UT 2.4 3„0.4 UT 3.5 3„1.1 UT 3.4 1 23„0.6 Hohe+2-1 0 1 2 Niedrige Fähigkeit Fähigkeit
Abb. 5: Partial Credit Analyse für die Hilfenbewertung 0-3 bei Trainings- und Kontrollaufgaben(Programm CREDIT, Masters, Wright& Ludlow 1982)
Trainingsitems eine hinreichend homogene Anforderung stellen.
In der unteren Hälfte von Abbildung 5 sind die Ergebnisse der Partial Credit Analyse für die Kontrollaufgaben wiedergegeben. Auch für sie fand sich eine hinreichend gute Anpassung an das Modell. Allerdings beruhen diese Werte nur auf 56 der 115 Kinder, weil in den übrigen Fällen keine Leistungsvariabilität vorlag. Nur beim ersten Kontrollitem des ersten und dritten Untertests konnte eine vollständige Abstufung der Hilfen empirisch nachgewiesen werden.
Beobachtungen zum Testverhalten der Kinder
Bei drei der neun Trainingsaufgaben fanden wir Hinweise für Schwankungen im Lösungs- und Lernverhalten:
1. Impulsive Lösungsversuche am Testanfang(Item 1.1) und fehlende Fokussierung auf die Klassifikationsmerkmale bei der vorangehenden Beispielaufgabe.
2. Perseveration des Klassifikationskriteriums Form beim Wechsel von Untertest I zu Untertest II. Darauf sind 50% aller Fehler beim ersten Lösungsversuch von Item 2.1 zurückzuführen.
159