Die Korrespondenzanalyse ist ein Struktur entdeckendes Verfahren, das dazu dient, komplexe Sachverhalte bei qualitativen Merkmalen zu vereinfachen und zu veranschaulichen. Im Ge-gensatz zur Mokkenskalierung und Faktorenanalyse werden somit keine ordinalen bzw. met-rischen Daten vorausgesetzt, bereits nominales Skalenniveau ist für die Anwendung der Pro-zedur ausreichend.
„Ziel der Korrespondenzanalyse ist die Visualisierung der Datenstruktur einer Kontingenzta-belle derart, dass die Beziehungen zwischen den Spalten und Zeilen sichtbar werden und di-mensional interpretiert werden können. Zu diesem Zweck werden die sog. Profile (= bedingte relative Häufigkeiten) der Zeilen und Spalten als Punkte in einem mehrdimensionalen Raum dargestellt. Dabei wird versucht, die Zahl der Dimensionen nach Möglichkeit auf eine oder zwei zu reduzieren, die relative Lage der Profilpunkte zueinander aber so gut wie möglich zu erhalten. Die Distanzen zwischen den Profilpunkten drücken ihre Ähnlichkeit oder Unähn-lichkeit aus. Je nach Art der Darstellung (asymmetrisch o. symmetrisch) ist es dann möglich, die Zeilen oder Spaltenkategorien nach Ähnlichkeiten/Unterschieden zu analysieren bzw. Zusammenhänge zwischen den Zeilen und Spalten der Tabelle zu erfassen“ .
Die folgenden Analysen beziehen sich auf den Datensatz der Europäischen Wertestudie von 1999 in Deutschland. Dieser Datensatz wurde in Gruppen nach Alter und regionaler Herkunft – West- oder Ostdeutschland – eingeteilt. Weiterhin wurden 25 Wertestatements ausgewählt. Mittels der Korrespondenzanalyse soll nun untersucht werden, ob sich die Teilgruppen hin-sichtlich ihrer Werteinstellungen unterscheiden.
Inhaltsverzeichnis
1 Einleitung
2 Zu den Daten
3 Durchführung der Korrespondenzanalyse
3.1 Zeilenprofile
3.2 Spaltenprofile
3.3 Auswertung
3.4 Übersicht über Zeilenpunkte
3.5 Übersicht über Spaltenpunkte
4 Interpretation der symmetrischen Darstellungen
4.1 Zeilenpunkte für Ausgewählte Werte
4.2 Spaltenpunkte für Alter und Region
4.2 Zeilen- und Spaltenpunkte
5 Überblick über die Ergebnisse
6 Anhang
6.1 Syntax
6.2 Tabellen und Grafiken
1 Einleitung
Die Korrespondenzanalyse ist ein Struktur entdeckendes Verfahren, das dazu dient, komplexe Sachverhalte bei qualitativen Merkmalen zu vereinfachen und zu veranschaulichen. Im Gegensatz zur Mokkenskalierung und Faktorenanalyse werden somit keine ordinalen bzw. metrischen Daten vorausgesetzt, bereits nominales Skalenniveau ist für die Anwendung der Prozedur ausreichend.
„Ziel der Korrespondenzanalyse ist die Visualisierung der Datenstruktur einer Kontingenztabelle derart, dass die Beziehungen zwischen den Spalten und Zeilen sichtbar werden und dimensional interpretiert werden können. Zu diesem Zweck werden die sog. Profile (= bedingte relative Häufigkeiten) der Zeilen und Spalten als Punkte in einem mehrdimensionalen Raum dargestellt. Dabei wird versucht, die Zahl der Dimensionen nach Möglichkeit auf eine oder zwei zu reduzieren, die relative Lage der Profilpunkte zueinander aber so gut wie möglich zu erhalten. Die Distanzen zwischen den Profilpunkten drücken ihre Ähnlichkeit oder Unähnlichkeit aus. Je nach Art der Darstellung (asymmetrisch o. symmetrisch) ist es dann möglich, die Zeilen oder Spaltenkategorien nach Ähnlichkeiten/Unterschieden zu analysieren bzw. Zusammenhänge zwischen den Zeilen und Spalten der Tabelle zu erfassen“[1].
Die folgenden Analysen beziehen sich auf den Datensatz der Europäischen Wertestudie von 1999 in Deutschland. Dieser Datensatz wurde in Gruppen nach Alter und regionaler Herkunft – West- oder Ostdeutschland – eingeteilt. Weiterhin wurden 25 Wertestatements ausgewählt. Mittels der Korrespondenzanalyse soll nun untersucht werden, ob sich die Teilgruppen hinsichtlich ihrer Werteinstellungen unterscheiden.
2 Zu den Daten
Die Variablen wurden in komprimierter Form eingegeben: es sind nur zwei Variablen vorhanden und mit ihrer jeweiligen Gewichtung versehen. Tabelle 2.1 gibt einen Überblick darüber:
Tabelle 2.1: Übersicht über die verwendeten Variablen
Abbildung in dieser Leseprobe nicht enthalten
Die dritte Variable „gewicht“ gibt an, welche Kombinationen der beiden anderen Variablen wie oft in der Stichprobe vorhanden sind. Nachdem der Datensatz soweit erstellt wurde wird die Gewichtung durchgeführt und im Anschluss daran mittels einer Kreuztabelle (siehe Anhang, Tabelle A1) überprüft, ob die soeben generierten Daten mit der Auswahl der Variablen übereinstimmen. Weiterhin kann man anhand der Randverteilungen und der Häufigkeiten bereits eine Vorauswahl der Variablenausprägungen treffen. Die vorliegende Kreuztabelle enthält keine auffällig niedrigen Fallzahlen, alle Zellen weisen Werte auf, die größtenteils sehr deutlich von Null verschieden sind. Mit den betrachteten Werten ist somit alles in Ordnung und die Korrespondenzanalyse kann ohne vorherigen Ausschluss einzelner Variablenausprägungen durchgeführt werden.
3 Durchführung der Korrespondenzanalyse
Für die Korrespondenzanalyse wird die symmetrische Darstellung verwendet, die zugehörige Syntax kann im Anhang eingesehen werden. Weiterhin befindet sich dort der unveränderte SPSS-Output[2]. Die im Folgenden dargestellten Tabellen wurden aus Gründen der Übersichtlichkeit optisch aufbereitet, stimmen jedoch inhaltlich mit den ursprünglichen überein.
3.1 Zeilenprofile
In der Zeilenprofildarstellung werden die einzelnen Zeilen (Wertestatements) miteinander verglichen. Die letzte Zeile gibt die Massen der Spalten wieder, also das durchschnittliche Zeilenprofil. Tabelle 3.1.1 stellt die Zeilenprofile dar:
Tabelle 3.1.1: Zeilenprofile*
Abbildung in dieser Leseprobe nicht enthalten
* In der Darstellung wurden die Abweichungen vom Durchschnittsprofil markiert. Hellgraue Felder bedeuten 30-50% Abweichung, dunkelgraue Felder entsprechen Abweichungen von über 50%. Positive Abweichungen sind zusätzlich fett hervorgehoben. Die unterstrichenen, großgeschriebenen Werte markieren Abweichungen von den Ergebnissen der noch folgenden Spaltenprofile.
Anhand dieser Darstellung kann man die Werte unabhängig von den absoluten Häufigkeiten miteinander vergleichen, d.h. man kann der Tabelle entnehmen, welchen Werten von welcher Gruppe besonders viel bzw. wenig Bedeutung zugemessen werden. Ein Beispiel hierfür: Religion wird insbesondere von den älteren westdeutschen als sehr wichtig angesehen, während die älteren ostdeutschen hier nur einen durchschnittlichen Wert haben.
Vergleicht man nun die durchschnittlichen Zeilenprofile mit den einzelnen Zeilenprofilen, so zeigt sich welchen Gruppen welchen Werten überdurchschnittlich häufig zugestimmt hat. Die Gruppe der über 50-jährigen Westdeutschen hat in der Gesamtdarstellung einen Anteil von etwa 26%, ihre Zustimmung zum Glauben an Gott beträgt jedoch fast 40% und liegt damit deutlich über dem Durchschnitt.
3.2 Spaltenprofile
Die Spaltenprofildarstellung ist das „Gegenstück“ zur Zeilenprofildarstellung. In ihr werden die einzelnen Spalten (Alter und regionale Herkunft) miteinander verglichen. Die letzte Spalte gibt die Massen der Zeilen wieder, also das durchschnittliche Spaltenprofil. Tabelle 3.2.1 stellt die Spaltenprofile dar:
Tabelle 3.2.1: Spaltenprofile*
Abbildung in dieser Leseprobe nicht enthalten
* In der Darstellung wurden die Abweichungen vom Durchschnittsprofil markiert. Hellgraue Felder bedeuten 30-50% Abweichung, dunkelgraue Felder entsprechen Abweichungen von über 50%. Positive Abweichungen sind zusätzlich fett hervorgehoben. Die unterstrichenen, großgeschriebenen Werte markieren Abweichungen von den Ergebnissen der weiter oben angeführten Zeilenprofile.
Anhand dieser Darstellung kann man die Gruppen unabhängig von den absoluten Häufigkeiten miteinander vergleichen, d.h. man kann der Tabelle entnehmen, welche Gruppe welchen Werten besonders viel bzw. wenig Bedeutung zumisst. Auch hierfür wieder ein Beispiel: Von allen hier betrachteten Wertestatements hat Nichtreligiosität sowohl in der Gruppe der jungen als auch der mittleren Ostdeutschen mit 0,078 bzw. 0,079 die höchste Zustimmung erhalten.
Vergleicht man nun die durchschnittlichen Spaltenprofile mit den einzelnen Spaltenprofilen, so zeigt sich welchen Wertstatements von welchen Gruppen überdurchschnittlich häufig zugestimmt wurde. An Gott glauben beispielsweise insgesamt etwa 4%, wäre dies bei allen Gruppen identisch, so müssten hier jeweils auch immer Werte von 0,04 vorliegen. Dies ist jedoch nicht der Fall, die Gruppe der älteren Westdeutschen liegt hier mit rund 7% deutlich über dem Durchschnitt.
Auffällig an den beiden soeben dargestellten Tabellen ist die hohe Übereinstimmung der Hervorhebungen. Jedoch wurden fünf der insgesamt 750 Werte in den beiden Tabellen mit unterschiedlichen Markierungen versehen. Da Zellen, die in der Zeilenprofildarstellung einen überdurchschnittlich hohen Wert gegenüber dem korrespondierenden durchschnittlichen Zeilenprofil haben gleichzeitig immer auch einen überdurchschnittlich hohen Wert in der Spaltenprofildarstellung gegenüber dem korrespondierenden Spaltenprofil haben, ist dieser Unterschied vermutlich auf Rundungsfehler zurückzuführen. Unmarkiert (weiß) verbleiben letztlich diejenigen Felder, die relativ nah (hier: unter 30%) am Durchschnittsprofil liegen.
3.3 Auswertung
Die folgende Tabelle 3.3.1 gibt Auskunft darüber, welcher Anteil der Variation durch das Modell erfasst wird:
Tabelle 3.3.1: Auswertung
Abbildung in dieser Leseprobe nicht enthalten
a 120 Freiheitsgrade
In der Spalte „Auswertung für Trägheit“ kann man ablesen, wie viel Variation in den Daten steckt und von den beiden Achsen erfasst wird. Die erste Achse erklärt bereits 2/3 der gesamten Variation, die zweite beinahe den kompletten Rest. Dies findet sich auch in der Spalte „Anteil der Trägheit“ wieder: Dimension 1 hat einen Anteil von 65,1%, die zweite 31,3%. Die übrigen drei Dimensionen wurden bereits anfangs aus der Betrachtung ausgeschlossen, weswegen die maximale Erklärung der Variation von 100% nicht erreicht werden kann. Zusammen werden von diesem Modell jedoch beachtliche 96,4% der Gesamtvariation erfasst, was einen sehr guten Wert darstellt und somit kaum Spielraum für Beanstandungen des Modells lässt.
3.4 Übersicht über Zeilenpunkte
SPSS gibt nicht nur eine Tabelle für die Trägheit des gesamten Modells aus, sondern schlüsselt auch die Trägheiten für die einzelnen Profile auf. Tabelle 3.4.1 gibt einen Überblick über die jeweiligen Zeilenpunkte:
[...]
[1] Fromm, Sabine (in Vorbereitung): Korrespondenzanalyse. Eine Einführung für Sozialwissenschaftler. Bamberger Beitrag. Band 16.
[2] Hinweis: Die hier dargestellten Tabellen wurden mit SPSS 11.5 erstellt, der Output anderer Programm-Versionen kann davon abweichen. Lediglich die grafischen Darstellungen wurden nachträglich mit SPSS 14.0 erstellt und sind bereits nachbearbeitet worden.