Texte
(Kapitel 11 - Seite 2 / 4)
Einführung in die Faktorenanalyse
Mit der Faktorenanalyse (FA) werden wir ein Verfahren kennenlernen,
das eine Vielfalt von Variablen aufgrund der Analyse der Interkorrelationsmatrix
ordnet und zu Clustern gruppiert. Unter einem Cluster verstehen
wir eine Gruppe von einander in gewissem Sinne ähnlichen Variablen.
An diese Cluster werden in der FA gewisse Bedingungen gestellt.
Als Voraussetzungen für die Anwendung des Verfahrens verlangen
wir allerdings dieselben, die für die Berechnung der Produkt-Moment-Korrelation
Bedingung sind.
Das Modell der Faktorenanalyse
Wir betrachten wiederum das Beispiel aus dem vorigen Kapitel:
Wir haben 7 Variablen mit Hilfe der Korrelationen untereinander
in zwei Gruppen aufgeteilt. Die Variablen bezeichnen wir im folgenden
mit x1 bis x7, eine beliebige der sieben Variablen wird mit xj bezeichnet. Der Meßwert einer Versuchsperson i in der Variablen
xj soll als xij bezeichnet werden. Also ist x2,5, der Meßwert der Antwortperson 2 in der Variablen 5 und so weiter.Die
Korrelation zwischen der Variablen xj und einer weiteren Variablen xk heißt rjk.
Wir wollen nun ein erstes Modell formulieren, das uns eine zunächst
vorläufige Vorstellung geben soll. Die Gruppenaufteilung der
Variablen bedeutet, daß die Antwortpersonen (oder Versuchspersonen)
auf die zu einer Gruppe gehörenden Variablen ähnlich reagieren.
Wir können uns vorstellen, daß der Meßwert einer Versuchsperson
i in einer Variablen j aus zwei Komponenten zusammengesetzt ist:
-aus dem Ausmaß, in dem die zu den Variablen einer Gruppe gehörende
Gemeinsamkeit für die Versuchsperson von Bedeutung ist und - aus
einer speziell diese Variable betreffenden Komponente. Bezeichnen
wir diese gemeinsame Komponente mit f und den spezifischen Anteil
mit u, können wir schreiben:
Die Indizierung soll verdeutlichen, daß der 'Meßwertteil' f, der
die Gruppengemeinsamkeit bezeichnet, abhängt von der jeweiligen
Versuchsperson i und dem spezifischen Anteil der Variablen j.
Bei allen zu einer Gruppen gehörenden Variablen ist ein Teil des
Meßwertes pro Versuchsperson gleich, nämlich fi. Die Varianz aller dieser Variablen kann also zum Teil auf die
Varianz einer Variablen zurückgeführt werden:
Mit Hilfe dieses noch sehr groben und wenig präzise formulierten
Modells kann aber schon plausibel gemacht werden, warum die
Korrelationen zwischen den Variablen einer Gruppe besonders hoch
sind. Natürlich ist dieser gemeinsame Anteil f nicht eigentlich
eine Variable; sie ist ja nicht gemessen und auch gar nicht wirklich,
sondern nur eine Annahme in unserer Modellüberlegung. Dieser,
allen zu einer Gruppen gehörenden Variablen gemeinsame, Varianzanteil
bewirkt natürlich eine Erhöhung der Korrelationen zwischen den
Variablen. Gehen wir davon aus, daß die spezifischen Anteile der
Variablen nichts miteinander zu tun haben (also unkorreliert sind),
kann die Korrelation rjk folgendermaßen ausgedrückt werden:
In die Covarianz geht nur der gemeinsame Varianzanteil ein, da
die Covarianz der spezifischen Anteile = 0 ist; in das Produkt
der Varianzen gehen nur die spezifischen Anteile ein, der gemeinsame
Anteil fällt heraus. (Auf eine präzisere mathematische Formulierung
soll hier bewußt verzichtet werden.) Je größer der gemeinsame
Anteil zweier Varablen im Verhältnis zu den spezifischen Anteilen
ist, desto größer ist die Korrelation.
|