Zur Startseite  
 
  LernStats    Glossar    Texte    Impressum    
backIndexnext Sprache wechseln: english
 



Download
LernStats zum Download
 Download von LernStats als zip-File (3.2MB)
 get Macromedia Flash


Jetzt Neu!
Der Methodenlehre-
Baukasten
Ein interaktives Lehr-Lernpropramm zur Deskriptiv- und Inferenzstatistik incl. multivariater Verfahren und weiteren Lernmodulen für die Methodenlehre


Interdisziplinäres Zentrum für Hochschuldidaktik - IZHD, Hamburg
   / Home / Texte / Faktorenanalyse / Modell der Faktorenanalyse


Texte
(Kapitel 11 - Seite 3 / 4)

Modell der Faktorenanalyse

In dem bisher formulierten Modell erkennen wir schnell den ersten Fehler: Wenn die Variablen einer Gruppe mit der zweiten Gruppe nichts Gemeinsames haben, also der gemeinsame Anteil = 0 sein soll, müßte, weil die Covarianz Null wäre, auch die Korrelation Null werden. Das ist aber offenbar nicht der Fall, auch die Variablen der eine Gruppe korrelieren mit denen der anderen Gruppe, wenn auch geringer als jeweils untereinander. Bezeichnen wir mit f1 die Gemeinsamkeit der ersten und mit f2 die der zweiten Gruppe, so ist f1i2 das Ausmaß der Neigung zu diesem und f2i2 das der Ausprägung zu jenem Anteil. Der Meßwert einer Versuchsperson setzt sich dann auch aus beiden theoretischen ´Variablenwerten´ und einem spezifschen Anteil zusammen. Dabei gehen aber die beiden Teilwerte f1i und f2i nicht gleichgewichtet in den Meßwert xij ein, sondern werden unterschiedlich gewichtet. Diese Gewichte nennen wir a:

      xij = aj1*f1i + aj2*f2i + uj+ej

Die Gewichtszahlen sind mit zwei Indizes versehen, von denen der eine die Variable, der andere die Gemeinsamkeit der jeweiligen Variablengruppe bezeichnet. Das soll bedeuten, daß der Anteil der jeweiligen Gruppengemeinsamkeit für jede Variable jeweils unterschiedlich stark einbezogen wird.

Mit der vorstehenden Gleichung haben wir nun das algebraische Modell der Faktorenanalyse schon fast richtig formuliert. Wir können jetzt schon sagen, daß das Ziel einer Faktorenanalyse ist, die Gewichtszahlen a, die auch Ladungszahlen heißen, auf rechnerischem Wege zu finden, also in etwa festzustellen, wie stark ( numerisch ausgedrückt) die Zugehörigkeit einer Variablen zu einer Gruppe ist.

      xij =... + uj + ej

Wir haben nun auch zwei spezifische Anteile, d.h. wir haben den spezifischen Anteil jeder Variablen in zwei unabhängige Komponenten geteilt. Neben dem eigentlichen spezifischen Anteil der Variablen stammt ein gewisser Teil der Varianz aus der Fehlerbelastung des Meßvorgangs, mit dem die Daten erhoben worden sind. Wir sprechen hier vom Fehleranteil oder der Fehlervarianz der Variablen.

Wir haben diese Berechnung für die 7 Variablen unseres Beispiels bereits vorgenommen, ohne daß der Leser an dieser Stelle nachvollziehen kann, wie diese Berechnung erfolgt ist. Die Autoren bitten hier um ein wenig Vertrauen; die Gewichtszahlen können aus den Korrelationen direkt berechnet werden, und wir werden an anderer Stelle auch zeigen, wie es geht. Für das Beispiel ergeben sich folgende Werte:

    Var. x a1 a2 a12 a22 h2 u2

    1

    2

    3

    4

    5

    6

    7

    .61

    .14

    -.21

    -.27

    .19

    -.46

    .60

    .65

    .81

    .86

    .87

    -.84

    .71

    .67

    .37

    .02

    .04

    .07

    .04

    .21

    .36

    .43

    .66

    .74

    .76

    .71

    .50

    .45

    .80

    .68

    .78

    .83

    .75

    .71

    .81

    .20

    .32

    .22

    .17

    .25

    .29

    .19

Die vier rechten Spalten werden weiter unten besprochen.

Wir sehen, daß in der Tat die Gewichts- oder Ladungszahlen der Variablen x1 und x7 in der ersten Gruppen besonders hoch, die der übrigen fünf Variablen in der zweiten Gruppe besonders hoch sind. Wir sehen weiter, daß die Ladungszahlen in der jeweils anderen Gruppe deutlich niedriger sind und erkennen zum letzten, daß die Variable x4 in der zweiten Gruppe eine zwar dem Betrag nach hohe aber negative Ladungszahl aufweist. Dies alles bildet unsere Beobachtungen der Interkorrelations-Matrix sehr schön und richtig ab.

Wir können also folgern, daß das Rechenverfahren der Faktorenanalyse in der Lage ist, eine bei vernünftiger Betrachtung der Interkorrelations-Matrix entstandene Variablenordnung rechnerisch wiederzugeben. Tatsächlich kann eine solche Ordnung auch dann noch errechnet werden, wenn die Vielzahl der Variablen das Vorgehen per Augenschein schon lange nicht mehr möglich macht.

Die Faktorenanalyse ist also ein statistisch-rechnerisches Verfahren, das aufgrund der Interkorrelations-Matrix eines Variablensatzes eine Ordnung der Variablen herstellt, indem für jede Variable die Ladungszahlen zu jeder Variablengruppe berechnet werden. Jede dieser Variablengruppen werden wir durch eine theoretische Variable repräsentieren, (die sozusagen das Zentrum dieser Gruppe darstellt). Diese künstlichen Repräsentanten nennt man Faktoren.

Wir werden jetzt die vier rechten Spalten der Beispieltabelle erläutern:

  • Spalte 4 (a12) und 5 (a22) enthalten die Quadrate der Spalten 2 (a1) und 3 (a2),
  • Spalte 6 enthält die Summe der Spalten 4 und 5, also a12 + a22 , und
  • Spalte 7 schließlich den Wert 1 - (a12 + a22),

Die Spalten 6 und 7 addieren sich also exakt zu 1.

Im Gegensatz zu unserem ersten Versuch einer Modellformulierung haben wir nun nicht mehr die Versuchspersonenwerte in den Faktoren ( die individuellen Ausprägungen jeder Gemeinsamkeit), sondern die Ladungszahlen ( die Gewichtungen pro Variable für jeden Faktor) berücksichtigt. Wir müssen die auf Seite 1 stehenden Ausdrücke für Varianz einer Vari-ablen und Korrelation zwischen zwei Variablen ebenfalls neu formulieren. Die Quadrate der Ladungszahlen sind die Anteile der auf EINS normierten Varianz der betreffenden Variablen an dem entsprechenden Faktor. Wenn man die Varianz der Variablen x1 gleich EINS setzt (oder gleich 100%), dann ist a11/SUB>2 = 0.37 (oder gleich 37%) der mit dem Faktor 1 gemeinsame Varianzanteil. (Die Ladungszahlen müssen quadriert werden, weil ja auch die Varianz eine quadrierte Größe ist). Den gemeinsamen Anteil mit beiden Faktoren nennt man die Kommunalität, den Rest bis EINS (oder 100%), den wir bisher ´spezifischen Anteil´ genannt haben, bezeichnet man auch als Uniqueness.

Die auf EINS normierte Varianz einer Variablen ist demnach:

Die Normierung auf EINS verlangt danach, statt der Rohdaten Standard-z-Werte zu verwenden, die immer den Mittelwert Null und die Varianz EINS haben.

Der richtige Ausdruck für die Korrelation ist etwas schwieriger zu finden. Sie hängt offensichtlich von den gemeinsamen Anteilen beider Variablen ab. Die Covarianz können wir als Summe aus den Produkten der jeweiligen Ladungszahlen auffassen. Damit erhalten wir für die Covarianz

Weil wir es, wie oben verlangt, mit standardisierten Variablen zu tun haben (Varianz = 1), ist die Korrelation gleich der Covarianz

und wir erhalten für die Korrelation:

Auch für diesen Ausdruck werden wir, wenn wir in der Diskussion der Faktorenanalyse fortgeschritten sind, zeigen, wie er algebraisch streng abgeleitet werden kann. Bis hierher hoffen wir, eine gewisse Plausibilität des Modells erreicht zu haben. Wir sind jetzt in der Lage, unsere Modellüberlegungen dadurch zu prüfen, daß wir mit Hilfe der obigen Formel und mit den (richtig ausgerechneten) Ladungszahlen die Korrelation ausrechnen und mit den empirisch gefundenen vergleichen: Die obere Dreiecksmatrix zeigt die errechneten, die untere Dreiecksmatrix die empirischen Korrelationen. In der Hauptdiagonalen finden wir die Korrelationen jeder Variablen mit sich selbst, ebenfalls errechnet nach

Rückgerechnet ergibt sich:

      1 2 3 4 5 6 7

      1

      2

      3

      4

      5

      6

      7

      .80

      .50

      .45

      .38

      -.47

      .21

      .64

      .61

      .68

      .60

      .61

      -.58

      .50

      .58

      .43

      .67

      .78

      .81

      -.71

      .66

      .45

      .40

      .67

      .81

      .83

      -.72

      .66

      .45

      -.13

      -.65

      -.76

      -.78

      .75

      -.58

      -.39

      .18

      .51

      .71

      .74

      -.68

      .71

      .29

      .80

      .63

      .45

      .42

      -.45

      .20

      .81



 
  LernStats    Glossar    Texte    Impressum    
backIndexnext Sprache wechseln: english