Texte
(Kapitel 10 - Seite 3 / 6)
multiple Korrelation
Das Beispiel, das wir zu Beginn verwendeten (Abitur und Test zur
Prognose des Studienerfolges) und das Rechenbeispiel (Intelligenz
und häusliche Arbeitsstunden zur Prognose des Studienerfolgs)
sollte demonstrieren, wie b- bzw. ß-Koeffizienten als Ergebnis
einer multiplen Regressionsanalyse interpretiert und verwendet
werden können. Allerdings wurden bisher nur die Anteile der einzelnen
Prädiktoren, nicht aber die Gesamtqualität der Prognose diskutiert.
Ebenso wie bei der einfachen Regression läßt sich die Qualität
der Prognose über die Größe der Differenzen , also der Abweichungen zwischen den tatsächlichen und den über
die Regressionsgleichung geschätzten Kriterienwerte beurteilen.
Es gibt nun einen Weg, die Güte der Prognose auch bei der multiplen
Regression über einen Koeffizienten zu bestimmen.
Die Berechnungsvorschrift für die Gewichte ist so festgelegt,
daß die Fehlervarianz bei der Schätzung der Kriterienwerte minimal
wird. Dieses Vorgehen nennt man 'Prinzip der kleinsten Quadrate'.
Im Kapitel 'Einfache Regression' wurden entsprechende Gedanken
und Ableitungen ausführlich vorgeführt.
Die Regressionsgerade bekommt dadurch eine an den Daten orientierte,
ideale Lage mit kleinst-möglichem Fehler. Wenn man also die Prädiktoren
mit Hilfe der b-Gewichte kombiniert, kann man mit dieser quasi
neuen, kombinierten Prädiktorvariablen das Kriterium bestmöglich
vorhersagen.
Zur Überprüfung der Qualität dieser Prognose kann uns nun die
multiple Korrelation dienen. Die multiple Korrelation (R) korreliert
diese optimal kombinierten Prädiktoren insgesamt mit der Kriteriumsvariablen.
R liegt zwischen 0 und 1. Negative Werte kommen nicht vor, da
umgekehrte Zusammenhänge mit einzelnen Prädiktoren durch negative
Gewichte ausgeglichen werden.
Wenn vor der Berechnung der multiplen Korrelation eine Regressionsrechnung
mit Bestimmung von ß-Gewichten durchgeführt wurde, ergibt sich
die multiple Korrelation nach folgender Formel:
Für den drei-variaten Fall können wir eine direkte Berechnungsvorschrift
angeben (1 Kriterium, 2 Prädiktoren):
Dieser drei-variate Fall läßt sich leicht mit der Berechnungsvorschrift
für ß aus der ersten Formel ableiten.
Die Interpretation von multiplen Korrelationen erfolgt ähnlich
der Bewertung von einfachen (Produkt-Moment-) Korrelationen. So
kann man auch hier einen gemeinsamen Varianzanteil zwischen den
gewichteten Prädiktoren einerseits und der Kriteriumsvariablen
andererseits über die Quadrierung von Ry.12 ... m angeben.
(multipler) Determinationskoeffizient = R2y.123...m
Zur Anwendung der Formeln soll das Rechenbeispiel aus der Regressionsanalyse
dienen. Da die Ergebnisse der Regressionsanalyse vorliegen, kann
die erste Berechnungsvorschrift verwendet werden:
Aus Vollständigkeitsgründen soll auch die zweite Formel Verwendung
finden:
(Der Unterschied ist sicherlich als Rundungsfehler abzutun). Man
kann leicht erkennen, daß die gewichtete Zusammenfassung deutlich
mehr gemeinsame Varianz des Kriteriums aufklärt als jeder einzelne
Prädiktor allein (R2y.12 = 68 % gegenüber r2yl = 36 % bzw. r2y2 = 10%).
Es ist weiter zu bemerken, daß keine bloße Addition der Varianzanteile
stattfindet, sondern durch die gewichtete Zusammenfassung ein
zusätzlicher Gewinn an gemeinsamer Varianz erreicht werden kann;
d.h. auch bei nur 2 Prädiktoren kann eine multiple Analyse sinnvoll
sein. Zusätzlich zu einer solchen Interpretation ermöglicht der
multiple Korrelationskoeffizient im Vergleich mit anderen noch
eine weitere bedeutsame Aussage. Wenn man mehrere Prädiktoren
untersucht, dann kann man diese nacheinander in eine Regressionsanalyse
eingehen lasen, um dann zu prüfen, ob die jeweilige Hinzunahme
eines weiteren Prädiktors auch relevanten Erkenntnisgewinn bringt.
Es ist also z.B. zu fragen, ob die Vorhersage eines Kriteriums
durch 5 Prädiktoren eine merklich höhere multiple Korrelation
bringt als eine durch 4 aus den 5 Prädiktoren. Allgemein formuliert
lautet die Frage:
Was "deutlich größer" konkret heißt, kann man quasi naiv durch
mehrere solcher Vergleiche festlegen. Es gibt auch statistische
Tests für solche Prüfungen.
|