Zur Startseite  
 
  LernStats    Glossar    Texte    Impressum    
backIndexnext Sprache wechseln: english
 



Download
LernStats zum Download
 Download von LernStats als zip-File (3.2MB)
 get Macromedia Flash


Jetzt Neu!
Der Methodenlehre-
Baukasten
Ein interaktives Lehr-Lernpropramm zur Deskriptiv- und Inferenzstatistik incl. multivariater Verfahren und weiteren Lernmodulen für die Methodenlehre


Interdisziplinäres Zentrum für Hochschuldidaktik - IZHD, Hamburg
   / Home / Texte / Spezielle Korrelationstechniken / tetrachorische Korrelation


Texte
(Kapitel 9 - Seite 8 / 10)

tetrachorische Korrelation

Als nächste Sonderform des Korrelationskoeffizienten besprechen wir die tetrachorische Korrelation rtet, da seine Berechnung ebenfalls auf dem schon bekannten Vierfelderschema beruht.

Die Fragestellung lautet hier wie folgt:
Wie läßt sich ein Zusammenhangsmaß berechnen für 2 Variablen, die prinzipiell intervallskaliert meßbar sind, die aber aus meßtechnischen Gründen nur in zwei alternativen Klassen vorliegen, d.h. also dichotomisiert wurden?
Ein konkretes Beispiel könnte so aussehen:

Von 100 Schülern liegen Daten vor, aus denen hervorgeht, ob sie in einer Partnerwahlbefragung häufig oder selten abgelehnt wurden. Die Ablehnungshäufigkeit wurde dichotomisiert: Schüler, die selten genannt wurden, wurden zu einer Klasse zusammengefaßt und den Schülern mit häufigen Ablehnungen (die eine weitere Klasse bilden) gegenübergestellt.

Von diesen 100 Schülern wird außerdem die Schulleistung erhoben. Die Variable wird aufgrund des Lehrerurteils, das die Schüler in "über- und unterdurchschnittlich" einteilt, dichotomisiert. Gefragt ist nach dem Zusammenhang zwischen Ablehnungshäufigkeit und Schulleistungen:

Ablehnungshäufigkeit

        weniger als 2x 2x und mehr Summe
        Schulleistung über Durchschnitt 40 10 50
        Schulleistung unter Durchschnitt 20 30 50
        Summe 60 40 100

Da die exakte Berechnung von rtet umständlich ist, begnügt man sich mit Näherungsmethoden. Die bekannteste unter ihnen ist die sogenannte cos phi-Formel. Sie ermöglicht es, einen meist ausreichend genauen Wert schnell zu bestimmen.

Wir rechnen

Die Interpretation dieses Koeffizienten wird genau so vorgenommen, wie wir es schon beim Phi-Koeffizienten kennengelernt haben. Das Vorzeichen hat keine Bedeutung, da es auch hier von der Anordnung der Vierfeldertafel abhängt; so hätten wir rtet = +.56 erhalten, wenn wir die Zeilen oder die Spalten vertauscht hätten. Die Richtung muß also wieder aus den Häufigkeiten in den vier Feldern herausgelesen werden.

Die leistungsbesseren Schüler werden seltener, die schwächeren häufiger von ihren Kameraden abgelehnt. Zum besseren Verständnis der Formel wollen wir uns klarmachen, unter welchen Bedingungen (d.h. Häufigkeitsverteilungen in den vier Feldern) sich maximale bzw. keine Korrelationen ergeben.

Bei idealer Korrelation sind die Felder der Diagonalen unbesetzt (entweder A und D oder B und C); der Wurzelausdruck ergibt eine Null. rtet ergibt dann:

  • entweder cos 0° = +1.00 ,
  • oder cos 180° = -1.00 .

Im Falle der statistischen Unabhängigkeit beider Variablen ist AD = BC, d.h. im Nenner steht genau ein doppelt so großer Betrag wie im Wurzelausdruck des Zählers, so daß sich ergibt:

rtet = cos(180°/(1+1)) = cos 90° = 0.00

Die angegebene Formel für rtet ist eine Schätzformel. Die Formel liefert die zuverlässigsten Schätzwerte, wenn die beiden Alternativen eines jeden Merkmals gleich häufig auftreten. Dann sind die Zeilensummen und die Spaltensummen gleich groß.

Weicht die Verteilung auf die beiden Variablenklassen geringfügig von diesen Werten ab (40 % und 60 %), so ist der dadurch entstehende Fehler klein (rtet wird um rund 0,02 falsch bestimmt). Bei ausgesprochen ungleicher Verteilung der Häufigkeiten auf die Randfelder (z.B. 10 % und 90 %) dagegen darf die cos(phi)-Formel nicht angewandt werden.



 
  LernStats    Glossar    Texte    Impressum    
backIndexnext Sprache wechseln: english