Leistung in der Schule ist ein Thema, das nicht nur in der schulischen Ausbildung kontrovers diskutiert
wird. Auch im Lehreralltag wird häufig diskutiert über Ungerechtigkeiten schulischer Zensuren und
den Sinn von Leistungsmaßstäben in der kindlichen Erziehung. Befurchtet wird vor allem eine
klasseninterne soziale Ausgrenzung durch "miese Noten" und ein hoher Erwartungsdruck der Eltern
an ihre Kinder. Diese Beobachtungen waren eigentlich schon der reformwilligen Nachkriegsgeneration
bekannt und wurden zu Beginn der 70er Jahre ideologisch übertrieben zur Kritik am "System" genutzt:
Das Leistungsprinzip wurde sogar als "entartet" gebrandmarkt und somit auch zur Ersatzreligion einer
säkularisierten Modeme deklariert, während seine konservativen Befürworter es als wichtigstes
fundamentales Grundprinzip moderner demokratischer Gesellschaften anpriesen (Ingenkamp &
Lissmann 2008: 132).
Leistungsprinzip und Noten. In den letzten 20 Jahren ist diese Debatte deutlich pragmatischer
geworden. Auch wenn eine notenlose Erziehung im Prinzip dasselbe erreichen könnte, wird auf eine
Zensurgebung gerade wegen des mittlerweile globalisierten Leistungsprinzips nicht gern verzichtet.
Eine Zensurgebung muss gerecht sein, aber auch internationalen Vergleichsmaßstäben genügen. In
der Lehrerausbildung ist daher ein objektivierterer Anspruch an die Zensurgebung zu sehen, der das
Vergleichbare als das Nötige sieht - und ideologische Fallen vermeidet. Das modeme
Leistungsverständnis in der Schule ist aber auch vermehrt an dem Ideal eines vernünftigen
Zusammenlebens orientiert, bei dem Furcht vor sozialer Ausgrenzung eben zu der Integration sozialer
und emotionaler Faktoren in den Unterricht fuhrt: Die beiden Pole Leistung vs. Freiheit der von den
68ern angestoßenen Debatte werden dem modemen Leistungsverständnis der Schule auch hier wenig
gerecht. Dem Schulsystem soll so eine Qualifikations-, Integrations- und Selektions funktion
zukommen, die dem Erwerb kognitiver als auch affektiver, sozialer als auch psychomotorischer
Fähigkeiten dient (Lukesch 1998: 25). Es geht also längst nicht nur um maßvolle Selektion anhand
kognitive Fähigkeiten, sondern auch um Integration. In der Theorie (Ingenkamp & Lissmann 2008:
132) sollte deshalb hier ein besonderes Einverständnis zwischen Schulen und Kultusministerien
herrschen, das kognitive Leistungen mit sozialen und emotionalen Lernzielen zu einer
charakterformenden Kompetenzerfahrung verbindet. [...]
Inhaltsverzeichnis
Tabellen- und Abbildungsverzeichnis
1 Vorwort: Probleme der schulischen Leistungsbeurteilung
2 Anspruch und Sinn von Schulleistungstests
3 Aufbau, Qualität und Formen von Schulleistungstest
4 Formen und Nebengütekriterien von Leistungstests
5 Die Praxis: Durchführung, Auswertung und Interpretation
6 Rückblick: Schulleistungstest für die Praxis
Anhang A: Der Hamburger Schulleistungstest für Vierte und Fünfte Klassen
Anhang B: Wichtige Konzepte der pädagogisch- psychologischen Diagnostik Verzeichnis der verwendeten Literatur
Tabellen- und Abbildungsverzeichnis
Tabelle 1: Die wichtigsten Gütekriterien für Schulleistungstest
Tabelle 2: Wichtige Nebengütekriterien
Tabelle 3: Die wichtigsten Schulleistungstests
Tabelle 4: Überblick über die Durchführung von Testverfahren
Abbildung 1 Teiltestung HST 4/5 - Rohwerte meiner 18 Schüler
Abbildung 2 HST – Testbereiche, Aufgaben und Reliabilität
Abbildung 3 HST-Test an der Feyel-Grundschule: Prozentrangplätze aller 18 Schüler
1 Vorwort: Probleme der schulischen Leistungsbeurteilung
Leistung in der Schule ist ein Thema, das nicht nur in der schulischen Ausbildung kontrovers diskutiert wird. Auch im Lehreralltag wird häufig diskutiert über Ungerechtigkeiten schulischer Zensuren und den Sinn von Leistungsmaßstäben in der kindlichen Erziehung. Befürchtet wird vor allem eine klasseninterne soziale Ausgrenzung durch “miese Noten” und ein hoher Erwartungsdruck der Eltern an ihre Kinder. Diese Beobachtungen waren eigentlich schon der reformwilligen Nachkriegsgeneration bekannt und wurden zu Beginn der 70er Jahre ideologisch übertrieben zur Kritik am “System” genutzt: Das Leistungsprinzip wurde sogar als “entartet” gebrandmarkt und somit auch zur Ersatzreligion einer säkularisierten Moderne deklariert, während seine konservativen Befürworter es als wichtigstes fundamentales Grundprinzip moderner demokratischer Gesellschaften anpriesen (Ingenkamp & Lissmann 2008: 132).
Leistungsprinzip und Noten. In den letzten 20 Jahren ist diese Debatte deutlich pragmatischer geworden. Auch wenn eine notenlose Erziehung im Prinzip dasselbe erreichen könnte, wird auf eine Zensurgebung gerade wegen des mittlerweile globalisierten Leistungsprinzips nicht gern verzichtet. Eine Zensurgebung muss gerecht sein, aber auch internationalen Vergleichsmaßstäben genügen. In der Lehrerausbildung ist daher ein objektivierterer Anspruch an die Zensurgebung zu sehen, der das Vergleichbare als das Nötige sieht - und ideologische Fallen vermeidet. Das moderne Leistungsverständnis in der Schule ist aber auch vermehrt an dem Ideal eines vernünftigen Zusammenlebens orientiert, bei dem Furcht vor sozialer Ausgrenzung eben zu der Integration sozialer und emotionaler Faktoren in den Unterricht führt: Die beiden Pole Leistung vs. Freiheit der von den 68ern angestoßenen Debatte werden dem modernen Leistungsverständnis der Schule auch hier wenig gerecht. Dem Schulsystem soll so eine Qualifikations-, Integrations- und Selektionsfunktion zukommen, die dem Erwerb kognitiver als auch affektiver, sozialer als auch psychomotorischer Fähigkeiten dient (Lukesch 1998: 25). Es geht also längst nicht nur um maßvolle Selektion anhand kognitive Fähigkeiten, sondern auch um Integration. In der Theorie (Ingenkamp & Lissmann 2008: 132) sollte deshalb hier ein besonderes Einverständnis zwischen Schulen und Kultusministerien herrschen, das kognitive Leistungen mit sozialen und emotionalen Lernzielen zu einer charakterformenden Kompetenzerfahrung verbindet.
Es gilt also, dass die Schulleistung im Grunde eine intraindividuelle Erfahrung ist – kein Kind kommt ohne soziale Bezugsnorm aus, aber der Umgang mit Zensuren vollzieht sich letzlich nur im Kopf des Kindes (Dinges 2002:16). Und auch für die ihnen Noten gebenden Lehrer gilt: sowohl als Form der Rückmeldung an die Schüler als auch zur Legitimation der eigenen Arbeit sind sie Teil des eigenen Selbstverständnisses und stärken manchmal auch das eigene Selbstbewußtsein angesichts des Unbehagens bei Versagen ihrer Kinder (Dinges 2002:16). Je nach Klassensituation werden Noten aber auch situativ gegeben: besonders bei inhomogenen Klassensituation werden Noten auch eingesetzt, um den internen Zusammenhalt der Klasse zu förden. Ohne besonders herausragende Schüler ist eine Klasse “schwerer in den Griff zu kriegen”. Daher geben Pädagogen auch gerne mit Noten Hinweise für erwünschtes Verhalten: als Belohnung für makelloses Betragen, zur Stärkung von Selbstwertgefühl und Fleiß und schließlich auch zur weiteren Entwicklung bei Versetzung in eine höhere Schulform. An einer Realschule wird ein besserer Notendurchschnitt und mehr Fleiß erwartet, aber nicht jeder Viertklässler kann und wird sich schon diesen Ansprüchen als würdig erweisen. Hier geben Lehrer durch Noten Empfehlung - und benoten auch die absehbare Entwicklung, nicht nur die momentane Leistung.
Sinn und Aufbau dieser Arbeit. In dieser Arbeit wird das Thema Schulleistungstest nicht nur aus einer pädagogisch-diagnostischen Warte betrachtet, sondern auch aus Perspektive der pädagogischen Praxis. Dazu wurde ein Rückgriff auf ein wichtiges pädagogisches Verfahren gemacht: nämlich Essentialisieren und Konzentration auf das Wesentliche, um Neulingen wie dem Autor einen vereinfachten Überblick über Grundprinzipien und Verfahren der pädagogischen Diagnostik zu ermöglichen. Die dem Autor bekannte Literatur stellt sich dem Thema pädagogische Diagnostik nämlich nur in zwei Formen: Anstrengende Überblickswerke über sämtliche pädagogisch-diagnostische Verfahren, oder praxisferne, aber eine generell objektivierte Leistungsbewertung anstrebende Monographien und stark vereinfachende Praxishandbücher für Lehrer. Dem Autor fehlte hier für sich selber eine kompakte Übersicht, die gerade das Thema “Schulleistungstest” thematisiert, ohne die wesentlichen Zusammenhänge zu vernachlässigen. Ferner ist dieses Thema für den Autor ein schwerer, aber wichtiger Teil seiner Lehrerausbildung. Auch deshalb schien es ihm angeraten, eine dichte und kompakte praxisnahe Einführungsarbeit zu schreiben, die im Moment vor allem mir selber beim Begreifen hilft – und später vielleicht mir und meinen Kollegen eine Basis gibt. Drittens wurde dem Autor von seinem Dozent angeraten, einen gewissen Sonderweg im Umgang mit seinem Referat über den Hamburger Schulleistungstest für die 4. und 5. Klasse einzuschlagen und lieber eine Überblicksarbeit über Schulleistungstest für dens schulischen Einsatz zu erstellen. Dies schien ihm auch selber angebracht, da er sich selber als ausgebildeter Publizistik- und Kulturwissenschaftler (M.A.) mit dem vereinfachen komplexer Zusammenhänge schwertut.
Für den Autor ist diese Arbeit daher eine Wiederholung des im Seminar “Diagnostik im schulischen Kontext” gelernten, eine vertiefende Umsetzung dieses Wissens für seine spätere Schulpraxis und eine intensive Erarbeitung der Vorteile objektivierter schulischer Leistungsmessung im Allgemeinen. Praxisnahe wird daher nach diesem Vorwort (1) zuerst auf die Mängel herkömmlicher Zensurgebung und die Vorteile von praxisnahen[1] Schulleistungstests (2) eingegangen, um dann (3) ihre Arten, ihren Aufbau und die Hauptgütekriterien kompakt, lesbar und sachlich richtig darzulegen. Daran anschließend, wird praxisgerecht auf wichtige Nebengütekriterien und bekannte Schulleistungstests eingegangen (4), um dann anhand meiner praktischen Erfahrungen mit dem Hamburger Schulleistungstest 4/5 die Praxis einer Schulleistungsmessung anhand von Beispielen und Tips zur Durchführung zu erläutern. Im Anhang dieser Arbeit findet sich noch eine präzise Übersicht über den Hamburger Schulleistungstest 4/5 mit mehr Details über dessen Gütekriterien und eine Auswertung meiner Teiltestung sowie eine kompaktes Glossar der wichtigsten Grundbegriffe der psychologisch-pädagogischen Diagnostik.
2 Anspruch und Sinn von Schulleistungstests
Schulleistungen sind an sich recht objektiv feststellbar, werden aber in der Praxis häufig durch pädagogische Intentionen verzerrt. Im stressigen schulischen Alltag sind Noten somit Ergebnis eines engen Zusammenspiels zwischen Schüler und Lehrer sowie eben dieses Bemühens um Zusammenhalt, Motivation, und eine positive weitere Entwicklung. Auch ohne pädagogische Intentionen werden schulische Prüfungen häufig etwas ungenau gestellt, nachlässig durchgeführt oder in der Auswertung von Vorurteilen und persönlichen Eigenheiten beinflusst. Untersuchungen zu mündlichen Prüfungen belegten, dass die Ansprüche an richtige Prüfungen in Form der Hauptgütekriterien Objektivität, Reliabilität (Zuverlässigkeit) und Validität (Gültigkeit) nicht oder kaum erfüllt werden. Bei mündlichen Prüfungen wird die Leistungsbewertung von Vorinformationen (über Noten), erstem Eindruck, der Reihenfolge der Prüflinge oder auch ihrem Sprechtempo beinflusst (Ingenkamp & Lissmann 2008: 141). Zum Beispiel wurde von Pritz (1981) eine mündliche Abiturprüfung im Fach Geographie nachgespielt und dann in zwei Fassungen - einer langsam gesprochenen und einer schnellen - 81 Geographielehrern von 25 Gymnasien zur Beurteilung vorgelegt. Basierend auf Sprechtempo und variierenden Vorzensuren vor allem im Fach Geographie, benoteten die Lehrer die Prüfungen mit Noten von 1 bis 5. Dabei wurden die fehlerfrei, aber langsam gesprochenen Prüfungen mit durchschnittlich 3,38 benotet, die flüssig gesprochenen Prüfungen dagegen mit dem Durchschnitt von 2,51 bewertet. Die ihren Lehrern bekannten Vorzensuren im Fach Geographie flossen dabei häufig in die Bewertung ein. Inhaltlich waren beide Prüfungen aber absolut identisch (Pritz 1981 in Ingenkamp & Lissmann 2008: 140).
Dasselbe gilt für schriftliche Prüfungen. Sogar in dem gerne als in der Auswertung sachlich – auswertungsobjektiv[2] - gesehenen Fach Mathematik ist eine ganz schwankungsfreie Auswertung nicht unbedingt die Regel. Zumindest in der Vergangenheit schwankte die Bandbreite vergebener Punkte oder Noten erheblich, neuere Untersuchungen belegen laut Ingenkamp und Lissmann (2008: 144) für schriftliche Prüfungen in praktisch jedem Schulfach die fehlende Übereinstimmung verschiedener Beurteiler. Für das Streuen der Noten verantwortlich sind dabei unter anderem die Länge der Texte, die Handschrift, die orthographischen Fehler (auch wenn nur der Inhalt zählen soll), aber auch die Beliebtheit der Schüler, das Geschlecht von Beurteiler und Beurteiltem und sogar Informationen über den sozialen Hintergrund der Schüler. In einer Studie von Weiss (1965) wurden Aufsätze abhängig von ihrer Schilderung des Schülers als begabter Redakteurssohn oder Schundromanleser mit durchschnittlicher Sprachbegabung signifikant unterschiedlich bewertet (Ingenkamp und Lissman 2008: 144-145).
Sinn von Zensuren. Somit ist also jede schulische Zensurgebung eigentlich Betrug. Nicht nur Betrug am Schüler, der nie genau seinen exakten Leistungsstand erfährt, und nicht nur Betrug an der Öffentlichkeit, sondern vor allem auch am Lehrer selbst, der nie selber genau die wahre Leistung seiner Schüler kennt. Schulische Leistungsmessung vermittelt der Öffentlichkeit einen Anspruch an Faktizität , den sie selber nie ganz erfüllt: hier gibt es zu viele Rand- und Rahmenbedingungen wie eben die Situationsabhängigkeit der Notengebung oder ihr gewollter Einsatz zur Motivationssteigerung. Was ist dann die Essenz schulische Leistungsmessung? Praktisch ist sie vor allem ein pädagogisches Instrument zur Leistungssteigerung. Hier greift das deutsche schulische System allerdings etwas zu kurz. Es geht ja nicht nur um klassen-oder schulinterne Zusammenhänge, sondern, seit den internationalen Schulvergleichsstudien, um den Vergleich verschiedener Schulformen untereinander und die Ursachen des eher mitttelmäßigen deutschen Leistungs- und auch Lehrniveaus. Das deutsche Schulsystem kann von objektivierter Leistungsmessung nur profitieren, wie ein altes Beispiel aus der Geschichte zeigt: Als in der Schweitz 1875 die Bewertungsmaßstäbe für die Rekrutierung in die Schweitzer Armee standartisiert und damit auswertungsobjektiver wurden, geschah ein Wunder: Ranglisten einzelner Kantone wurden erstellt, die Kantone richteten selbständig Schulen und Vorbereitungskurse für leistungsschwache Anwärter mit eigenen Schulabschlussprüfungen ein, und auch die Rekruten wurden deutlich fleißiger (Tresch 2007: 16).
Vorteile objektiver Leistungsmessung. Nicht nur das deutsche Schulsystem würde sich durch solch objektive Verfahren der Leistungsmessung also sichtbar verbessern. Auch bietet die Integration von Schulleistungstests in das reformwillige und weiter zu reformierende deutsche Schulwesen einen weiteren, nicht zu unterschätzenden, Vorteil: eine sichtbare Hinwendung zu mehr Sachlichkeit und mehr Wissenschaftlichkeit. Das Hauptinteresse unseres auch durch PISA zur Reform gedrängten Schulsystems besteht ja im Erreichen des höchstmöglichen Leistungsniveaus von Schülern und dem Anschluss an internationale Standards, und neben Innovationen in Lehrplanentwicklung und Strukturplanung (Gaude & Teschner 1971: 19) werden besonders solch objektive Verfahren der Leistungskontrolle unserem Schulsystem einen Anstoß zu größerer Sachlichkeit in der Umsetzung und Beachtung der Lehrpläne geben: “Der Nutzen dieser Messverfahren liegt also nicht in ihrer Vollständigkeit, sondern in ihrem Beitrag zur Objektivierung des Lehr – und Lernprozesses und vor allem dessen Kontrolle, Beachtung und Steuerung in den für die notwendigen Berechtigungsklauseln relevanten Bereichen.“ (Gaude und Teschner 1971: 19).
Im Gesamten würde der Einsatz der objektiven “Bewährungs- und Kontrollsysteme” (Tresch 2007: 27) das deutsche Bildungsystem also weiter verbessern. Sachlichere Leistungsmessungen werden erstmal allgemein das deutsche Schul- und Lernniveau langfristig anheben, und durch schiere Präsenz in der Schule auch an Sachlichkeit im Umgang mit Lehrplänen und Lernzielen erinnern. Die gesamtgesellschaftliche Forderung an Objektivität in der Zensurgebung sollte von den Lehrern verstanden werden – und hier bieten die an einer großen Eichstichprobe überprüften Schulleistungstests eine bessere Alternative zu einer an der “Bezugsgruppe Klasse” festgemachtem Notenvergabe. So erlaubt eine objektivere, situationsunabhängigere Leistungsmessung auch eine bessere Prognose über den gesellschaftlich relevanten kindlichen Entwicklungsverlauf (Ingenkamp & Lissmann 2008: 135).
[...]
[1] Internationale Schulvergleichsstudien wie PISA oder TIMMS werden in dieser Arbeit nicht weiter berücksichtigt, da sie nicht Gegenstand unsers Seminars waren (und im Schulallatag eher Anregung als praktisch nutzbares Werkzeug sind ).
[2] Wichtige Grundbegriffe der Schulleistungsdiagnostik sind sowohl im Glossar angegeben als auch im Laufe der Arbeit genauer erklärt, um die Lesbarkeit der Arbeit nicht durch allzu schwer verständliche Definitionen zu gefährden.