Texte
(Kapitel 9 - Seite 3 / 10)
Kendall's Tau
Bisher hatten wir es mit nominalskalierten Variablen oder mit
künstlich dichotomisierten Variablen, von denen wir annehmen konnten,
daß sie im Prinzip intervalskaliert messbar sind, zu tun. Jetzt
wollen wir Zusammenhangsmaße kennenlernen für den Fall der Korrelation
zweier ordinalskalierbarer Variablen.
Fragestellung:
Welcher Zusammenhang besteht zwischen den Variablen "Schulbildung"
und "Schichtzugehörigkeit"? Die Frage nach der Schulbildung mit
den möglichen Klassen "ohne Abschluß", "Volksschule", "Realschule",
"Gymnasium", "Universität" und die Einschätzung der Schichtzugehörigkeit
über den ausgeübten Beruf mit den Klassen "Unterschicht", "untere
Mittelschicht", "obere Mittelschicht", "untere Oberschicht", "obere
Oberschicht" liefert Maßzahlen mit Ordinalskalenqualität, da für
jedes beobachtete Meßwertträgerpaar eine größer-,kleiner- oder
gleich-Relation gilt.
Die Berechnung eines Rangkorrelationskoeffizienten ist deshalb
vorzunehmen. Wir verwenden KENDALL's TAU.
Berechnungsprozedur:
Es werden Rangreihen für beide Variablen aufgestellt. Eine der
beiden Variablen wird in ihre natürliche Rangfolge gebracht (1,2,3,
...,(N-1),N), die Rangplätze der gleichen Fälle in der anderen
Variablen werden darunter geschrieben. So entsteht eine (für die
1. Variable) geordnete Rangreihe. In der 2. Rangreihe (der untergeordneten)
wird nun für jedes mögliche Zahlenpaar ausgezählt, wie oft jeweils
die Zahlen eines Paares in ´richtiger´ Ordnung (entsprechend ihrer
natürlichen Reihenfolge, z.B. 1,4 oder 3,5) bzw. in ´falscher
Ordnung´ (z.B. 3,1 oder 5,2) auftreten.
Ein Beispiel soll das erläutern:
Folgende Rohdaten von 5 Vpn mögen vorliegen:
| Vp |
A |
B |
C |
D |
E |
| Rangplatz in Schulbildung |
4 |
1 |
5 |
3 |
2 |
| Rangplatz in Schichtzugehörigkeit |
5 |
3 |
4 |
1 |
2 |
N = 5
Der Berechnungsprozedur folgend ordnen wir die 5 Vpn entsprechend
ihren Rangplätzen in der Variablen "Schulbildung" (wir hätten
auch die andere wählen können).
| Vp |
B |
E |
D |
A |
C |
| Rangplatz in Schulbildung |
1 |
2 |
3 |
4 |
5 |
| Rangplatz in Schichtzugehörigkeit |
3 |
2 |
1 |
5 |
4 |
Nun haben wir die Daten so geordnet, daß wir die Anzahl ´richtiger´
und ´falscher´ Zahlenpaare auszählen können:
B: 3-2; 3-1; 3-5; 3-4;
E: 2-1; 2-5; 2-4;
D: 1-5; 1-4;
A: 5-4.
Insgesamt überprüfen wir 10 Zahlenpaare. Für jede ´richtige´ Zahlenfolge
zählen wir ein "Plus", für jede ´falsche´ Reihenfolge ein "Minus".
B: 3-2; 3-1; 3-5; 3-4;
+ +
E: 2-1; 2-5; 2-4;
+ +
D: 1-5; 1-4;
+ +
A: 5-4
-
Wir zählen 6-Plus und 4-Minuszeichen, gegeneinander aufgerechnet
ergibt sich die Summe S = 2. Diese Summe S wird bei der Berechnung
von Tau in Beziehung gesetzt zur höchstmöglichen Summe dieser
Art Smax.
Smax errechnet sich aus N(N-1)/2. Dieses ist leicht einzusehen, denn
die Gesamtzahl von Paarvergleichen hängt nur von N (also der Länge
der Rangreihe ab). Ist die zweite Rangreihe identisch mit der
ersten (geordneten), so ergeben sich beim Paarvergleich nur `richtige´
Reihenfolgen und die Gesamtsumme des "Plus-Zeichen" ist gleich
der Summe der insgesamt möglichen Paarvergleiche Smax.
Tau ergibt sich als TAU = S/Smax.
In unserem Beispiel ist Smax = 5*4/2 = 10.
TAU ist also gleich 2/10 = .5
Diese Berechnungsart kann nur dann angewendet werden, wenn innerhalb
einer Rangreihe keine gleichen Rangplätze auftreten, d.h. also
nicht mehrer Vpn den gleichen Rangplatz zugewiesen bekamen. Dieses
wäre dann der Fall, wenn unter unseren 5 Vpn mehrere z.B. Abitur
als Schulbildung gehabt hätten. Die Berechnung von TAU wird dann
etwas komplizierter. Ein Beispiel findet sich in: FRÖHLICH/BECKER
(1972).
Es soll noch darauf hingewiesen weden, daß TAU mit anderen Korrelationskoeffizienten
nicht vergleichbar ist und daß in der Literatur häufig ein anderer
Korrelationskoeffizient Anwendung findet, nämlich SPEARMAN´s RHO.
Ein anderer Nachteil von TAU ist der, daß bei gegebenen N TAU
nur soviel Werte annehmen kann wie Smax+1 entspricht, in unserem Beispiel also 1; S hätte theoretisch
die Werte -10, -8, -6, -4, -2, 0, +2, +4, +6, +8, +10 annehmen
können; eine ungerade Summe S kann es in diesem Fall nicht geben,
da "Plus gegen "Minus" aufgerechnet wird.
Allgemein gilt:
Bei geradem N kann S nur gerade, bei ungeradem N nur ungerade
Werte annehmen.
TAU kann also von vornherein in unserem Beispiel bei N = 5 nur
.00, .20, .40, .60, .80 oder 1.00 werden; Zwischenabstufungen
kann es nicht geben. Tau ist demnach nur ein äußerst grobes Maß.
|