Textbook
(Chapter 5 - Page 1 / 3)
Zusammenhangsmaße
Bisher haben wir uns mit Kennwerten eindimensionaler (= univariater)
Verteilungen beschäftigt. Es ging dabei um die Verteilung von
Meßwerten einer Variablen über den Maßstab (= Skala), der zum
Messen benutzt wurde.
Mit Zusammenhangsmaßen werden grundsätzlich zwei Variablen bzw.
die Verteilung von Meßwerten zweier Variablen berechnet; man spricht
in diesem Zusammenhang auch von bivariaten Verteilungen.
Wir erinnern noch einmal an das, was über Merkmale bzw. Variablen
gesagt wurde:
Eine Variable heißt deshalb Variable, weil verschiedene Ausprägungsgrade
dieser Variablen beobachtet (gemessen) werden können. In einer
Schulklasse kann der Intelligenzquotient (IQ) der Kinder verschieden
hoch, im Extremfall für jedes Kind anders gemessen worden sein.
Daneben wird es eine Reihe anderer Merkmale (Variablen) geben,
die ebenfalls variieren, z.B. das Alter, die Körpergröße, das
Geschlecht, die Zensuren in den verschiedenen Unterrichtsfächern.
Betrachten wir einmal neben den IQ-Werten die Leistung von Kindern
in einem Rechentest. Den Forscher (aber auch den Laien) wird es
interessieren, ob die beiden Variablen "etwas miteinander zu tun
haben", ob sie "miteinander zusammenhängen" oder wissenschaftlicher
ausgedrückt, ob sie in ähnlicher Weise variiieren, ob sie gemeinsam
variieren.
Gemeinsame Varianz oder gemeinsame Variation ist für das Verständnis
von Zusammenhangsmaßen von grundlegender Bedeutung.
Was verstehen wir nun unter gemeinsamer Varianz? Das folgende
Beispiel soll das verdeutlichen:
Nehmen wir einmal an, die Kinder einer Schulklasse haben einen
Intelligenztest und einen Rechentest absolviert. Die dabei gemessenen
Werte sind der nebenstehenden Tabelle zu entnehmen.
Vp |
IQ |
RT |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 |
120
118
100
102
96
90
112
115
116
104
95
108
111
119
101 |
10
7
4
4
1
3
6
8
8
5
4
6
7
10
5 |
durchschnittlicher IQ = 107
durchschnittlicher RT = 5.9
Übertragen Sie die Vpn-Meßwerte in ein graphisches Koordinatensystem,
wobei die beiden Skalen (RT und IQ-Meßwertskalen) die x- und y-Achse
bilden. Von graphischen Häufigkeitsverteilungen, wie Sie sie bisher
kennengelernt haben, unterschiedet sich diese Graphik insofern,
als daß Sie in diesem Fall die Werte von zwei Variablen in einer
Zeichnung darstellen müssen.
Die Punkte in dieser bivariaten Häufigkeitsverteil-ung ergeben
sich als Schnittpunkte der Lote, die auf der RT-Achse und der
IQ-Achse jeweils in den entsprechenden Variablenwerten errichtet
werden; sie bestimmen die Lage der Vp in dieser Fläche.
In dieser Zeichnung fällt auf, daß eher hohe Werte (bezogen auf
den Mittelwert) in einer Variablen zusammen vorkommen mit ebenfalls
eher hohen Werten in der anderen Variablen (Vp 1). Ebenfalls kommen
offenbar eher niedrige Werte in einer Variablen mit eher niedrigen
Werten in der anderen Variablen vor (Vp 5).
Nahe beim Mittelwert liegende Meßwerte einer Variablen finden
sich zusammen mit mittleren Werten der anderen Variablen (Vp 15).
Es läßt sich also verallgemeinernd formulieren:
Je höher der IQ-Wert ist, desto höher ist auch der Punktwert im
Rechentest und umgekehrt (je niedriger...).
Mit gleicher Berechtigung läßt sich aber auch sagen: Je höher
der Punktwert im Rechentest ist, desto höher ist auch der IQ-Wert
und umgekehrt.
Die Aussage "je ... desto" deutet nicht auf ein Ursache-Wirkungs-Verhältnis
der beiden Variablen. Die Kausalitätsfrage: "Was bedingt was?"
wird bei der Berechnung von Zusammenhängen zunächst nicht gestellt.
Der eben besprochene Sachverhalt wird nun als gemeinsame Variation
zweier Meßwertreihen bezeichnet. Die beiden Meßwerte je einer
Vp liegen auf den Meßwertskalen ähnlich; ähnlich bezogen auf ihre
Lage zu ihrem Mittelwert. Je ähnlicher sich die Meßwertpaare auf
den Skalen sind, desto höher ist der Anteil an gemeinsamer Variation.
Nun spricht man aber nicht nur dann von gemeinsamer Variation,
wenn hohe Werte einer Variablen mit hohen Werten der anderen Variablen
zusammen beobachtert werden (bzw. niedrige Werte der einen Variablen
mit niedrigen Werten der anderen Variablen). Gemeinsame Variation
ist auch dann vorhanden, wenn hohe Werte in einer Variablen mit
niedrigen Werten in der anderen Variablen zusammenfallen (bzw.
niedrige Werte mit hohen Werten). In solchem Fall liegt ebenso
ein systematischer Zusammenhang wie im besprochenen Beispiel vor,
lediglich die Richtung des Zusammenhangs ist eine andere.
Gemeinsame Variation ist nicht vorhanden, wenn hohe Werte in einer
mit sowohl hohen als auch niedrigen Werten in der anderen Variablen
vorkommen oder umgekehrt.
Ein Punkteschwarm einer zweidimensionalen Häufigkeitsverteilung,
der von links unten nach rechts oben verläuft, deutet immer auf
einen positiven Zusammenhang hin. Ein Punkteschwarm, der von links
oben nach rechts unten verläuft, deutet immer auf einen negativen
Zusammenhang hin.
Die Enge des Zusammenhangs hängt davon ab, wie schmal die Punktewolke
sich erstreckt (wie dicht die Punkte an einer durch die Wolke
gedachten Geraden liegen); je schmaler (je "zigarrenförmiger")
die Punktewolke, desto enger der Zusammenhang.
Eine kreisförmige Punktewolke deutet darauf hin, daß überhaupt
kein Zusammenhang zwischen den Variablen besteht: Ein niedriger
x-Wert kommt mit sowohl niedrigen, mittleren als auch hohen y-Werten
vor, ein niedriger y-Wert mit sowohl niedrigen, mittleren und
hohen
x-Werten (und jeweils umgekehrt).
|