Zur Startseite  
 
  LernStats    Glossary    Textbook    Imprint    
backIndexnext
 



Download
Download LernStats
 Download LernStats to your computer as a zip-archive (MB)
 get Macromedia Flash


Interdisziplinäres Zentrum für Hochschuldidaktik - IZHD, Hamburg

IEE
   / Home / Textbook / Correlation / The Product-Moment Coefficient of Correlation


Textbook
(Chapter 5 - Page 2 / 3)

Produkt-Moment-Korrelation

Wir suchen nun ein Maß, welches uns nicht nur angibt, wie eng der Zusammenhang (bzw. wie hoch der Anteil an gemeinsamer Variation) zweier Merkmale ist, sondern welches auch etwas darüber aussagt, wie die Richtung des Zusammenhangs aussieht.

Außerdem soll dieses Maß unabhängig vom gewählten Maßstab bzw. der Meßskala sein; d.h. wir wollen ein Maß, das uns auch etwas über den Zusammenhang zweier Variablen, die unterschiedlich skaliert sind, aussagt (wie z.B. Risikobereitschaft/ Extraversion oder Leistungsmotivation/ Offenheit).

Weiterhin soll das Maß unabhängig sein von der Stichprobengröße, damit wir Zusammenhangsmaße auch aus unterschiedlichen Untersuchungen miteinander vergleichen können.

Dieses Maß ist der sogenannte "Produkt-Moment-Korrelations-Koeffizient". Er wurde von PEARSON und BRAVAIS entwickelt. Wenn im folgenden von Korrelation die Rede ist, ist immer der Produkt-Moment-Korrelations-Koeffizient gemeint, es sei denn, es wird etwas anderes vermerkt.

Die Formel der Korrelation wurde so konstruiert, daß die numerische Größe des Koeffizienten nie größer als +1 und nie kleiner als -1 werden kann (es sei denn, man verrechnet sich!).

Je höher der Wert der Korrelation (je näher er bei +1 oder -1 liegt), desto enger ist der Zusammenhang zwischen den betrachteten Variablen.

Das Vorzeichen der Korrelation sagt nichts über die Enge des Zusammenhangs, sondern nur etwas über die Richtung des Zusammenhangs aus. Ein fehlender Zusammenhang drückt sich durch eine Korrelation nahe Null aus.

Gewöhnlich werden Korrelationen wie folgt interpretiert:

        .00 = kein Zusammenhang
        .00 bis .25 = niedriger "
        .25 bis .50 = mittlerer "
        .50 bis .75 = hoher "
        .75 bis 1.0 = vollständiger "

Diese Werte stellen ungefähre Richtgrößen und keine exakten Grenzwerte dar.
So sollte man z.B. eine Korrelation von .08 nicht als "niedrigen Zusammenhang", sondern als "kein Zusammenhang" interpretieren.

Die Formulierung "Zusammenhang zwischen zwei Merkmalen" darf aber nicht falsch aufgefaßt werden. Es ist nicht gemeint, daß zwischen zwei Merkmalen (x und y) ein kausaler Zusammenhang besteht. Der Korrelationskoeffizient an sich läßt keine Aussage über ein Ursache-Wirkungs-Verhältnis zu, etwa in dem Sinne, daß das Merkmal x das Merkmal y bewirke.

So kann man beispielsweise eine hohe positive Korrelation zwischen Intelligenz und Schulleistung nicht ohne weiteres so interpretieren, daß die Schulleistung aufgrund der Intelligenz zustandekomme. Ein solcher Koeffizient besagt zunächst nur, daß ein Schüler mit hoher (niedriger) Intelligenz auch meist gute (schlechte) Schulleistungen zeigen wird. Das Zustandekommen dieses Zusammenhangs könnte aber durch eine Reihe alternativer Ursachen erklärt werden, es mag z.B. eine dritte Variable dafür verantwortlich sein (z.B. sozioökonomischer Status der Eltern).

Nun können wir uns im Rahmen möglichst exakter Wissenschaft nicht mit Schätzungen begnügen, sondern müssen versuchen, genaue Werte zu berechnen. Deshalb können wir auf die Formel zur Berechnung des Koeffizienten der Produkt-Moment-Korrelation nicht verzichten.

    Die Korrelation ist die Summe der Abweichungsprodukte aller xi und yi vom jeweiligen Mittelwert, geteilt durch die Summe der Abweichungsquadrate aller xi mal der aller yi.

Anwendungsregeln:

  1. Die Meßwerte der Versuchsperson bezüglich des Merkmals 1 (x-Werte) und des Merkmals 2 (y-Werte) werden in eine Tabelle so eingetragen, daß für jede Versuchsperson die beiden Meßwerte nebeneinander stehen.
  2. Die x- und y-Werte werden quadriert und (bei Randrechnung) in die Tabelle eingetragen.
  3. Für jedes Meßwertpaar wird das Produkt xy gebildet.
  4. Die Werte in den Spalten x, y, x2, y2 und xy werden addiert.
  5. Die erhaltenen Größen werden in die Formel eingetragen.

Wir wollen diese Regel gleich einmal auf das eingangs dargestellte Beispiel anwenden:

x = Intelligenzquotient (IQ) / y = Rechentestleistung (RT)

Vp x y x2 y2 x * y

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

120

118

100

102

96

90

112

115

116

104

95

108

111

119

101

10

7

4

4

1

3

6

8

8

5

4

6

7

10

5

14400

13924

10000

10404

9216

8100

12544

13225

13456

10816

9025

11664

12321

14161

10201

100

49

16

16

1

9

36

64

64

25

16

36

49

100

25

1200

826

400

408

96

270

672

920

928

520

380

648

777

1190

505

In diesem (fiktiven) Beispiel liegt eine sehr hohe positive Korrelation von .92 vor (die Null vor dem Dezimalpunkt wird in der Regel weggelassen und man liest: "Punkt zweiundneunzig").

Um den Produkt-Moment-Korrelations-Koeffizienten berechnen zu können, müssen folgende Voraussetzungen erfüllt sein:

  1. Die zu korrelierenden Daten müssen auf Intervallskalenniveau gemessen worden sein.
  2. Die Beziehung zwischen den beiden Merkmalen x und y muß linear sein.
  3. Deshalb müssen die Merkmale a) eingipflig und b) symmetrisch verteilt sein.
  4. Die Bedingungen 2) und 3) sind immer dann erfüllt, wenn die Merkmale normalverteilt sind.

Was man unter Normalverteilung versteht, soll hier nicht genauer dargestellt werden.
Hier nur soviel:
Die Normalverteilung sieht glockenförmig aus und besagt, daß Werte, die nur geringfügig vom Mittelwert abweichen, sehr häufig beobachtet werden, Extremwerte dagegen sehr selten. Je größer die Abweichung vom Mittelwert ist, desto geringer ist die Wahrscheinlichkeit, einen solchen extremen Meßwert auch tatsächlich zu messen.

Beispiel:
Menschen über 2,00 Meter Körpergröße sind selten, genauso solche unter 1,40 Meter. Die meisten Menschen haben eine durchschnittliche Körpergröße (um 1,70 Meter herum).

Linearität bedeutet im übrigen, daß der Punkteschwarm einer bivariaten Verteilung am besten durch eine Gerade repräsentiert werden kann und nicht etwa durch eine kurvenlineare Funktion (Parabel, Hyperbel o.ä.).



 
  LernStats    Glossary    Textbook    Imprint    
backIndexnext