Texte
(Kapitel 9 - Seite 8 / 10)
tetrachorische Korrelation
Als nächste Sonderform des Korrelationskoeffizienten besprechen
wir die tetrachorische Korrelation rtet, da seine Berechnung ebenfalls auf dem schon bekannten Vierfelderschema
beruht.
Die Fragestellung lautet hier wie folgt:
Wie läßt sich ein Zusammenhangsmaß berechnen für 2 Variablen,
die prinzipiell intervallskaliert meßbar sind, die aber aus meßtechnischen
Gründen nur in zwei alternativen Klassen vorliegen, d.h. also
dichotomisiert wurden?
Ein konkretes Beispiel könnte so aussehen:
Von 100 Schülern liegen Daten vor, aus denen hervorgeht, ob sie
in einer Partnerwahlbefragung häufig oder selten abgelehnt wurden.
Die Ablehnungshäufigkeit wurde dichotomisiert: Schüler, die selten
genannt wurden, wurden zu einer Klasse zusammengefaßt und den
Schülern mit häufigen Ablehnungen (die eine weitere Klasse bilden)
gegenübergestellt.
Von diesen 100 Schülern wird außerdem die Schulleistung erhoben.
Die Variable wird aufgrund des Lehrerurteils, das die Schüler
in "über- und unterdurchschnittlich" einteilt, dichotomisiert.
Gefragt ist nach dem Zusammenhang zwischen Ablehnungshäufigkeit
und Schulleistungen:
Ablehnungshäufigkeit
|
weniger als 2x |
2x und mehr |
Summe |
| Schulleistung über Durchschnitt |
40 |
10 |
50 |
| Schulleistung unter Durchschnitt |
20 |
30 |
50 |
| Summe |
60 |
40 |
100 |
Da die exakte Berechnung von rtet umständlich ist, begnügt man sich mit Näherungsmethoden. Die
bekannteste unter ihnen ist die sogenannte cos phi-Formel. Sie
ermöglicht es, einen meist ausreichend genauen Wert schnell zu
bestimmen.
Wir rechnen
Die Interpretation dieses Koeffizienten wird genau so vorgenommen,
wie wir es schon beim Phi-Koeffizienten kennengelernt haben. Das
Vorzeichen hat keine Bedeutung, da es auch hier von der Anordnung
der Vierfeldertafel abhängt; so hätten wir rtet = +.56 erhalten, wenn wir die Zeilen oder die Spalten vertauscht
hätten. Die Richtung muß also wieder aus den Häufigkeiten in den
vier Feldern herausgelesen werden.
Die leistungsbesseren Schüler werden seltener, die schwächeren
häufiger von ihren Kameraden abgelehnt. Zum besseren Verständnis
der Formel wollen wir uns klarmachen, unter welchen Bedingungen
(d.h. Häufigkeitsverteilungen in den vier Feldern) sich maximale
bzw. keine Korrelationen ergeben.
Bei idealer Korrelation sind die Felder der Diagonalen unbesetzt
(entweder A und D oder B und C); der Wurzelausdruck ergibt eine
Null. rtet ergibt dann:
- entweder cos 0° = +1.00 ,
- oder cos 180° = -1.00 .
Im Falle der statistischen Unabhängigkeit beider Variablen ist
AD = BC, d.h. im Nenner steht genau ein doppelt so großer Betrag
wie im Wurzelausdruck des Zählers, so daß sich ergibt:
rtet = cos(180°/(1+1)) = cos 90° = 0.00
Die angegebene Formel für rtet ist eine Schätzformel. Die Formel liefert die zuverlässigsten
Schätzwerte, wenn die beiden Alternativen eines jeden Merkmals
gleich häufig auftreten. Dann sind die Zeilensummen und die Spaltensummen
gleich groß.
Weicht die Verteilung auf die beiden Variablenklassen geringfügig
von diesen Werten ab (40 % und 60 %), so ist der dadurch entstehende
Fehler klein (rtet wird um rund 0,02 falsch bestimmt). Bei ausgesprochen ungleicher
Verteilung der Häufigkeiten auf die Randfelder (z.B. 10 % und
90 %) dagegen darf die cos(phi)-Formel nicht angewandt werden.
|