Textbook
(Chapter 4 - Page 2 / 6)
Durchschnittliche Abweichung
Die beiden Verteilungen der Abbildung auf der vorigen Seite der
Übung zeigen, daß - besonders bei einem größerem Stichprobenumfang
- der Range als Dispersionsmaß (Streuungsmaß) wohl zu grob ist:
Die dazugehörigen Verteilungen sind:
xi |
f(xi)1 |
f(xi)2 |
1
2
3
4
5
6
7 |
10
30
40
50
40
30
10 |
10
10
30
70
30
10
10 |
AM
Mod
Median
Range |
4
4
4
6 |
4
4
4
6 |
Obwohl alle Lagewerte gleich sind und der Range ebenfalls gleich
ist, obwohl die Verteilungsform in beiden Fällen eingipflig symmetrisch
ist, unterscheiden sich die beiden Häufigkeitsverteilungen erheblich.
Wir suchen nun eine Maßzahl, die diesen Unterschied ausdrücken
kann!
Die naheliegende Möglichkeit ist wohl, die Meßwerte bezüglich
ihrer Dichte zum AM zu charakterisieren. In einem Fall liegen
fast alle Meßwerte nahe am AM, im anderen Fall relativ viele Werte
weit vom AM entfernt.
Wir werden also für jede Verteilung die Abstände der Meßwerte
zum AM ermitteln und zusammenzählen. Wir machen dieses aus Übersichtlichkeitsgründen
zunächst beim ersten Beispiel (das Alter der 2 mal 5 Gruppenmitglieder):
Gruppe 1 |
|
Gruppe 2 |
|
Alter |
Abstand vom AM |
Alter |
Abstand vom AM |
12
14
22
40
42 |
14
12
4
14
16 |
22
24
26
28
30 |
4
2
0
2
4 |
Wir erhalten:
Um die Zahlen handhabbarer zu machen und Vergleiche bei Gruppen
mit verschiedener Mitgliederzahl (= verschiedener Stichprobenumfang)
zu ermöglichen, relativieren wir die Gruppen, indem wir durch
die Anzahl der Meßwerte teilen:
Summe Gr. 1/Anzahl = 60 : 5 = 12
Summe Gr. 2/Anzahl = 12 : 5 = 2,4.
Man sieht, daß sich durch diese Manipulation nichts ändert, die
eine Maßzahl ist immer noch 5 mal so groß wie die der anderen
Gruppen; wir haben quasi nur gekürzt. Das Maß, das wir durch diese
Überlegung erhalten, heißt:
" durchschnittliche Abweichung", "AD" (= Average Deviation).
Es ist definiert als:
das Arithmetische Mittel der Abstände aller Meßwerte vom Arithmetischen
Mittel dieser Meßwerte, d.h. die Summe aller Abstände geteilt
durch die Anzahl der Meßwerte.
Als Formel schreibt sich das so:
Die "| |" bedeuten "Betrag von", d.h.wir betrachten die Differenz
immer als positive Zahl, weil sich die (relativen) Differenzen
zu Null aufsummieren.
Im Falle gruppierter Daten heißt die Formel analog:
In einem zweiten Beispiel berechnen wir die durchschnittliche
Abweichung:
|
1.Stichprobe |
|
2.Stichprobe |
|
 |
 |
 |
 |
 |
1
2
3
4
5
6
7 |
10
30
40
50
40
30
10 |
3
2
1
0
1
2
3 |
10
10
30
70
30
10
10 |
3
2
1
0
1
2
3 |
 |
210
|
|
170
|
|
 |
|
4 |
|
4 |
AD |
1,24 |
|
0,94 |
|
|