Texte
(Kapitel 11 - Seite 3 / 4)
Modell der Faktorenanalyse
In dem bisher formulierten Modell erkennen wir schnell den ersten
Fehler: Wenn die Variablen einer Gruppe mit der zweiten Gruppe
nichts Gemeinsames haben, also der gemeinsame Anteil = 0 sein
soll, müßte, weil die Covarianz Null wäre, auch die Korrelation
Null werden. Das ist aber offenbar nicht der Fall, auch die Variablen
der eine Gruppe korrelieren mit denen der anderen Gruppe, wenn
auch geringer als jeweils untereinander. Bezeichnen wir mit f1 die Gemeinsamkeit der ersten und mit f2 die der zweiten Gruppe, so ist f1i2 das Ausmaß der Neigung zu diesem und f2i2 das der Ausprägung zu jenem Anteil. Der Meßwert einer Versuchsperson
setzt sich dann auch aus beiden theoretischen ´Variablenwerten´
und einem spezifschen Anteil zusammen. Dabei gehen aber die beiden
Teilwerte f1i und f2i nicht gleichgewichtet in den Meßwert xij ein, sondern werden unterschiedlich gewichtet. Diese Gewichte
nennen wir a:
Die Gewichtszahlen sind mit zwei Indizes versehen, von denen der
eine die Variable, der andere die Gemeinsamkeit der jeweiligen
Variablengruppe bezeichnet. Das soll bedeuten, daß der Anteil
der jeweiligen Gruppengemeinsamkeit für jede Variable jeweils
unterschiedlich stark einbezogen wird.
Mit der vorstehenden Gleichung haben wir nun das algebraische
Modell der Faktorenanalyse schon fast richtig formuliert. Wir
können jetzt schon sagen, daß das Ziel einer Faktorenanalyse ist,
die Gewichtszahlen a, die auch Ladungszahlen heißen, auf rechnerischem
Wege zu finden, also in etwa festzustellen, wie stark ( numerisch
ausgedrückt) die Zugehörigkeit einer Variablen zu einer Gruppe
ist.
Wir haben nun auch zwei spezifische Anteile, d.h. wir haben den
spezifischen Anteil jeder Variablen in zwei unabhängige Komponenten
geteilt. Neben dem eigentlichen spezifischen Anteil der Variablen
stammt ein gewisser Teil der Varianz aus der Fehlerbelastung des
Meßvorgangs, mit dem die Daten erhoben worden sind. Wir sprechen
hier vom Fehleranteil oder der Fehlervarianz der Variablen.
Wir haben diese Berechnung für die 7 Variablen unseres Beispiels
bereits vorgenommen, ohne daß der Leser an dieser Stelle nachvollziehen
kann, wie diese Berechnung erfolgt ist. Die Autoren bitten hier
um ein wenig Vertrauen; die Gewichtszahlen können aus den Korrelationen
direkt berechnet werden, und wir werden an anderer Stelle auch
zeigen, wie es geht. Für das Beispiel ergeben sich folgende Werte:
| Var. x |
a1 |
a2 |
a12 |
a22 |
h2 |
u2 |
|
1
2
3
4
5
6
7 |
.61
.14
-.21
-.27
.19
-.46
.60 |
.65
.81
.86
.87
-.84
.71
.67 |
.37
.02
.04
.07
.04
.21
.36 |
.43
.66
.74
.76
.71
.50
.45 |
.80
.68
.78
.83
.75
.71
.81 |
.20
.32
.22
.17
.25
.29
.19 |
Die vier rechten Spalten werden weiter unten besprochen.
Wir sehen, daß in der Tat die Gewichts- oder Ladungszahlen der
Variablen x1 und x7 in der ersten Gruppen besonders hoch, die der übrigen fünf Variablen
in der zweiten Gruppe besonders hoch sind. Wir sehen weiter, daß
die Ladungszahlen in der jeweils anderen Gruppe deutlich niedriger
sind und erkennen zum letzten, daß die Variable x4 in der zweiten Gruppe eine zwar dem Betrag nach hohe aber negative
Ladungszahl aufweist. Dies alles bildet unsere Beobachtungen der
Interkorrelations-Matrix sehr schön und richtig ab.
Wir können also folgern, daß das Rechenverfahren der Faktorenanalyse
in der Lage ist, eine bei vernünftiger Betrachtung der Interkorrelations-Matrix
entstandene Variablenordnung rechnerisch wiederzugeben. Tatsächlich
kann eine solche Ordnung auch dann noch errechnet werden, wenn
die Vielzahl der Variablen das Vorgehen per Augenschein schon
lange nicht mehr möglich macht.
Die Faktorenanalyse ist also ein statistisch-rechnerisches Verfahren,
das aufgrund der Interkorrelations-Matrix eines Variablensatzes
eine Ordnung der Variablen herstellt, indem für jede Variable
die Ladungszahlen zu jeder Variablengruppe berechnet werden. Jede
dieser Variablengruppen werden wir durch eine theoretische Variable
repräsentieren, (die sozusagen das Zentrum dieser Gruppe darstellt).
Diese künstlichen Repräsentanten nennt man Faktoren.
Wir werden jetzt die vier rechten Spalten der Beispieltabelle
erläutern:
- Spalte 4 (a12) und 5 (a22) enthalten die Quadrate der Spalten 2 (a1) und 3 (a2),
- Spalte 6 enthält die Summe der Spalten 4 und 5, also a12 + a22 , und
- Spalte 7 schließlich den Wert 1 - (a12 + a22),
Die Spalten 6 und 7 addieren sich also exakt zu 1.
Im Gegensatz zu unserem ersten Versuch einer Modellformulierung
haben wir nun nicht mehr die Versuchspersonenwerte in den Faktoren
( die individuellen Ausprägungen jeder Gemeinsamkeit), sondern
die Ladungszahlen ( die Gewichtungen pro Variable für jeden Faktor)
berücksichtigt. Wir müssen die auf Seite 1 stehenden Ausdrücke
für Varianz einer Vari-ablen und Korrelation zwischen zwei Variablen
ebenfalls neu formulieren. Die Quadrate der Ladungszahlen sind
die Anteile der auf EINS normierten Varianz der betreffenden Variablen
an dem entsprechenden Faktor. Wenn man die Varianz der Variablen
x1 gleich EINS setzt (oder gleich 100%), dann ist a11/SUB>2 = 0.37 (oder gleich 37%) der mit dem Faktor 1 gemeinsame Varianzanteil.
(Die Ladungszahlen müssen quadriert werden, weil ja auch die Varianz
eine quadrierte Größe ist). Den gemeinsamen Anteil mit beiden
Faktoren nennt man die Kommunalität, den Rest bis EINS (oder 100%),
den wir bisher ´spezifischen Anteil´ genannt haben, bezeichnet
man auch als Uniqueness.
Die auf EINS normierte Varianz einer Variablen ist demnach:
Die Normierung auf EINS verlangt danach, statt der Rohdaten Standard-z-Werte
zu verwenden, die immer den Mittelwert Null und die Varianz EINS
haben.
Der richtige Ausdruck für die Korrelation ist etwas schwieriger
zu finden. Sie hängt offensichtlich von den gemeinsamen Anteilen
beider Variablen ab. Die Covarianz können wir als Summe aus den
Produkten der jeweiligen Ladungszahlen auffassen. Damit erhalten
wir für die Covarianz
Weil wir es, wie oben verlangt, mit standardisierten Variablen
zu tun haben (Varianz = 1), ist die Korrelation gleich der Covarianz
und wir erhalten für die Korrelation:
Auch für diesen Ausdruck werden wir, wenn wir in der Diskussion
der Faktorenanalyse fortgeschritten sind, zeigen, wie er algebraisch
streng abgeleitet werden kann. Bis hierher hoffen wir, eine gewisse
Plausibilität des Modells erreicht zu haben. Wir sind jetzt in
der Lage, unsere Modellüberlegungen dadurch zu prüfen, daß wir
mit Hilfe der obigen Formel und mit den (richtig ausgerechneten)
Ladungszahlen die Korrelation ausrechnen und mit den empirisch
gefundenen vergleichen: Die obere Dreiecksmatrix zeigt die errechneten,
die untere Dreiecksmatrix die empirischen Korrelationen. In der
Hauptdiagonalen finden wir die Korrelationen jeder Variablen mit
sich selbst, ebenfalls errechnet nach
Rückgerechnet ergibt sich:
|