Textbook
(Chapter 5 - Page 2 / 3)
Produkt-Moment-Korrelation
Wir suchen nun ein Maß, welches uns nicht nur angibt, wie eng
der Zusammenhang (bzw. wie hoch der Anteil an gemeinsamer Variation)
zweier Merkmale ist, sondern welches auch etwas darüber aussagt,
wie die Richtung des Zusammenhangs aussieht.
Außerdem soll dieses Maß unabhängig vom gewählten Maßstab bzw.
der Meßskala sein; d.h. wir wollen ein Maß, das uns auch etwas
über den Zusammenhang zweier Variablen, die unterschiedlich skaliert
sind, aussagt (wie z.B. Risikobereitschaft/ Extraversion oder
Leistungsmotivation/ Offenheit).
Weiterhin soll das Maß unabhängig sein von der Stichprobengröße,
damit wir Zusammenhangsmaße auch aus unterschiedlichen Untersuchungen
miteinander vergleichen können.
Dieses Maß ist der sogenannte "Produkt-Moment-Korrelations-Koeffizient".
Er wurde von PEARSON und BRAVAIS entwickelt. Wenn im folgenden
von Korrelation die Rede ist, ist immer der Produkt-Moment-Korrelations-Koeffizient
gemeint, es sei denn, es wird etwas anderes vermerkt.
Die Formel der Korrelation wurde so konstruiert, daß die numerische
Größe des Koeffizienten nie größer als +1 und nie kleiner als
-1 werden kann (es sei denn, man verrechnet sich!).
Je höher der Wert der Korrelation (je näher er bei +1 oder -1
liegt), desto enger ist der Zusammenhang zwischen den betrachteten
Variablen.
Das Vorzeichen der Korrelation sagt nichts über die Enge des Zusammenhangs,
sondern nur etwas über die Richtung des Zusammenhangs aus. Ein
fehlender Zusammenhang drückt sich durch eine Korrelation nahe
Null aus.
Gewöhnlich werden Korrelationen wie folgt interpretiert:
Diese Werte stellen ungefähre Richtgrößen und keine exakten Grenzwerte
dar.
So sollte man z.B. eine Korrelation von .08 nicht als "niedrigen
Zusammenhang", sondern als "kein Zusammenhang" interpretieren.
Die Formulierung "Zusammenhang zwischen zwei Merkmalen" darf aber
nicht falsch aufgefaßt werden. Es ist nicht gemeint, daß zwischen
zwei Merkmalen (x und y) ein kausaler Zusammenhang besteht. Der
Korrelationskoeffizient an sich läßt keine Aussage über ein Ursache-Wirkungs-Verhältnis
zu, etwa in dem Sinne, daß das Merkmal x das Merkmal y bewirke.
So kann man beispielsweise eine hohe positive Korrelation zwischen
Intelligenz und Schulleistung nicht ohne weiteres so interpretieren,
daß die Schulleistung aufgrund der Intelligenz zustandekomme.
Ein solcher Koeffizient besagt zunächst nur, daß ein Schüler mit
hoher (niedriger) Intelligenz auch meist gute (schlechte) Schulleistungen
zeigen wird. Das Zustandekommen dieses Zusammenhangs könnte aber
durch eine Reihe alternativer Ursachen erklärt werden, es mag
z.B. eine dritte Variable dafür verantwortlich sein (z.B. sozioökonomischer
Status der Eltern).
Nun können wir uns im Rahmen möglichst exakter Wissenschaft nicht
mit Schätzungen begnügen, sondern müssen versuchen, genaue Werte
zu berechnen. Deshalb können wir auf die Formel zur Berechnung
des Koeffizienten der Produkt-Moment-Korrelation nicht verzichten.
Die Korrelation ist die Summe der Abweichungsprodukte aller xi und yi vom jeweiligen Mittelwert, geteilt durch die Summe der Abweichungsquadrate
aller xi mal der aller yi.
Anwendungsregeln:
- Die Meßwerte der Versuchsperson bezüglich des Merkmals 1 (x-Werte)
und des Merkmals 2 (y-Werte) werden in eine Tabelle so eingetragen,
daß für jede Versuchsperson die beiden Meßwerte nebeneinander
stehen.
- Die x- und y-Werte werden quadriert und (bei Randrechnung) in
die Tabelle eingetragen.
- Für jedes Meßwertpaar wird das Produkt xy gebildet.
- Die Werte in den Spalten x, y, x2, y2 und xy werden addiert.
- Die erhaltenen Größen werden in die Formel eingetragen.
Wir wollen diese Regel gleich einmal auf das eingangs dargestellte
Beispiel anwenden:
x = Intelligenzquotient (IQ) / y = Rechentestleistung (RT)
Vp |
x |
y |
x2 |
y2 |
x * y |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 |
120
118
100
102
96
90
112
115
116
104
95
108
111
119
101 |
10
7
4
4
1
3
6
8
8
5
4
6
7
10
5 |
14400
13924
10000
10404
9216
8100
12544
13225
13456
10816
9025
11664
12321
14161
10201 |
100
49
16
16
1
9
36
64
64
25
16
36
49
100
25 |
1200
826
400
408
96
270
672
920
928
520
380
648
777
1190
505 |
In diesem (fiktiven) Beispiel liegt eine sehr hohe positive Korrelation
von .92 vor (die Null vor dem Dezimalpunkt wird in der Regel weggelassen
und man liest: "Punkt zweiundneunzig").
Um den Produkt-Moment-Korrelations-Koeffizienten berechnen zu
können, müssen folgende Voraussetzungen erfüllt sein:
- Die zu korrelierenden Daten müssen auf Intervallskalenniveau gemessen
worden sein.
- Die Beziehung zwischen den beiden Merkmalen x und y muß linear
sein.
- Deshalb müssen die Merkmale a) eingipflig und b) symmetrisch verteilt
sein.
- Die Bedingungen 2) und 3) sind immer dann erfüllt, wenn die Merkmale
normalverteilt sind.
Was man unter Normalverteilung versteht, soll hier nicht genauer
dargestellt werden.
Hier nur soviel:
Die Normalverteilung sieht glockenförmig aus und besagt, daß Werte,
die nur geringfügig vom Mittelwert abweichen, sehr häufig beobachtet
werden, Extremwerte dagegen sehr selten. Je größer die Abweichung
vom Mittelwert ist, desto geringer ist die Wahrscheinlichkeit,
einen solchen extremen Meßwert auch tatsächlich zu messen.
Beispiel:
Menschen über 2,00 Meter Körpergröße sind selten, genauso solche
unter 1,40 Meter. Die meisten Menschen haben eine durchschnittliche
Körpergröße (um 1,70 Meter herum).
Linearität bedeutet im übrigen, daß der Punkteschwarm einer bivariaten
Verteilung am besten durch eine Gerade repräsentiert werden kann
und nicht etwa durch eine kurvenlineare Funktion (Parabel, Hyperbel
o.ä.).
|