folien zur vorlesung - wirtschaftswissenschaftliche fakultät · folien zur vorlesung statistik i...
Post on 16-May-2019
222 Views
Preview:
TRANSCRIPT
Folien zur Vorlesung
Statistik I(Deskriptive Statistik)
Wintersemester 2010/2011Donnerstag, 10.00 - 11.30 Uhr
Horsaal: Aula am Aasee
Prof. Dr. Bernd Wilfling
Westfalische Wilhelms-Universitat Munster
Inhalt
1 Einleitung1.1 Was ist Statistik und warum ist Statistik wichtig?1.2 Beispiele fur statistische Fragestellungen in der Okonomik1.3 Deskriptive und schließende Statistik
2 Mathematische Grundlagen
2.1 Endliche Summen und Produkte2.2 Exponentialfunktion und Logarithmus
3 Merkmale und Daten3.1 Grundgesamtheiten3.2 Merkmale
3.3 Daten und ihre Erhebung3.4 Amtliche und nichtamtliche Statistik
4 Auswertung eindimensionaler Daten4.1 Beliebig skalierte Daten
4.2 Mindestens ordinal skalierte Daten4.3 Metrisch skalierte Daten4.3.1 Lagemessung4.3.2 Weitere Mittelwerte
4.3.3 Streuungsmaße4.3.4 Additionssatze fur arithmetische Mittel und Varianzen
4.3.5 Stetig klassierte Daten4.3.6 Schiefemessung
5 Verhaltniszahlen, Messzahlen und Indexzahlen
5.1 Verhaltniszahlen5.2 Messzahlen des zeitlichen Vergleichs5.2.1 Umbasierung und Verkettung von Messzahlen
5.2.2 Zuwachsraten und Zuwachsfaktoren5.2.3 Logarithmische Zuwachsraten
5.3 Indexzahlen5.3.1 Preisindizes
5.3.2 Mengenindizes
i
5.3.3 Wertindizes5.3.4 Umbasierung und Verkettung von Indizes
5.3.5 Formale Indexkriterien (Fisher-Proben)
6 Auswertung mehrdimensionaler Daten6.1 Grundbegriffe6.1.1 Kontingenztafel und Haufigkeiten
6.1.2 Bedingte Verteilungen
6.1.3 Deskriptive Unabhangigkeit
6.1.4 Arithmetische Mittel und Varianzen6.2 Zusammenhangsmaße6.2.1 Metrische Daten: Korrelationskoeffizient6.2.2 Ordinale Daten: Rangkorrelationskoeffizient6.2.3 Nominale Daten: Kontingenzkoeffizient
6.3 Deskriptive Regression6.3.1 Regression 1. Art6.3.2 Regression 2. Art: Die lineare Einfachregression
6.4 Lineare Mehrfachregression
7 Konzentrations- und Disparitatsmessung
7.1 Disparitat und Konzentration
7.2 Konzentrationsmessung7.2.1 Konzentrationsraten und Konzentrationskurve
7.2.2 Konzentrationsindizes7.3 Disparitatsmessung
7.3.1 Lorenzkurve7.3.2 Der Gini-Koeffizient
ii
Literatur
EViews:
EViews 7 User Guide (2009). Estimation, Forecasting, Statistical Analysis, Graphs, Data
Management, Simulation. QMS Quantitative Micro Software, Irvine, California.
Statistik:
Hartung, J. (2005). Statistik – Lehr- und Handbuch der angewandten Statistik (14. Aufla-
ge). Oldenbourg Verlag, Munchen.
Mosler, K. und F. Schmid (2009). Beschreibende Statistik und Wirtschaftsstatistik (4. Auf-
lage). Springer Verlag, Heidelberg.
iii
1. Einleitung
Ziel der Vorlesung:
• Einfuhrung in deskriptive Statistik + Wirtschaftsstatistik
Internet-Seite der Vorlesung:
• http://www1.wiwi.uni-muenster.de/oeew/
−→ Studium −→ Veranstaltungen im Wintersemester 2010/2011
−→ Bachelor −→ Statistik I
1
Vorlesungsstil:
• Freier Vortrag anhand von Projektor-Folien
• Folien stehen als PDF-Dateien auf Internetseite zur Verfugung(Beschaffung der Folien wird unbedingt empfohlen)
Literatur:
• K. Mosler und F. Schmid (2009). Beschreibende Statistikund Wirtschaftsstatistik (4. Auflage), Springer-Verlag
• Formelsammlung ”Definitionen, Formeln und Tabellen zurStatistik” (6. Auflage) von Bomsdorf/Grohn/Mosler/Schmid(notwendiges Hilfsmittel, in der Klausur zugelassen)
2
Klausurvorbereitung:
• Stoff der Vorlesung
• Aufgaben des Tutoriums
Ansprechpartner: Herr Sascha Leweling
• Klausurtraining durch Ferienarbeitsgruppen
3
Zugelassene Hilfsmittel in der Klausur:
• Taschenrechner (nicht programmierbar)
• Formelsammlung ”Definitionen, Formeln und Tabellen zurStatistik” von Bomsdorf/Grohn/Mosler/Schmid, 6. (aktuelleund fruhere) Auflage(n)Akzeptierte außere Form fur die Klausur:
– Zulassig sind nur Unter- bzw. Uberstreichungen, Verweiseauf Seiten bzw. Nummern
– Nicht zulassig sind somit z.B. verbale Erlauterungen, math-ematische Umformungen, grafische Darstellungenu.a., die als Losungshilfen fur Klausuraufgaben angese-hen werden konnen
4
Ansprechpartner:
• Herr Sascha Leweling(Koordinator der Tutorien)
• Tutorinnen und Tutoren(Adressen und Nummern: siehe Tutorien)
5
1.1 Was ist Statistik und warum ist Statistik wichtig?
Typischer Lexikon-Eintrag fur den Begriff ’Statistik’:
• Methode zur Untersuchung von Massenerscheinungen
• Versuch, den Umfang, die Gliederung oder Struktur einerMasse, die zeitliche Entwicklung einer oder das Verhaltnismehrerer Massenerscheinungen zueinander zu erkennen
• Aufgabe der Statistik besteht in der Darstellung, Analyse undDeutung von Daten
6
Anwendungsbereiche fur statistische Methoden:
• heutzutage in allen Wissenschaftsbereichen, z.B. in
der Biologie / Medizin (Biometrie)
den Ingenieurswissenschaften (Technometrie)
den Verhaltenswissenschaften (Psychometrie)
Besonders wichtig fur WiWis:
• Empirische Wirtschaftsforschung
• Okonometrie
7
Ziele der Statistik: [I]
• Aufdeckung von Zusammenhangen, z.B.
Zusammenhang Arbeitslosigkeit ←→ InflationZusammenhang Arbeitslosigkeit ←→ WachstumAuswirkungen von Geldpolitik auf wirtschaftliche Aktivitat
• Uberwachung okonomischer Aktivitat, z.B.
ArbeitslosenquoteWachstumsraten (BIP, Konsum)Aktienkurse, Wechselkurse, Zinssatze, Rohstoff- und Im-mobilienpreise
8
Ziele der Statistik: [II]
• Uberprufung von WiWi-Theorien anhand von Daten, z.B.
Zusammenhang zwischen verfugbarem Einkommen undKonsumausgaben
Einfluss demokratischer Strukturen auf wirtschaftliche Ak-tivitat
Bedeutung des Wahrungssystems fur den wirtschaftlichenErfolg
9
1.2 Beispiele fur statistische Fragestellungen inder Okonomik
(a) Preis eines Gutes:
• Preis einer Feinunze Gold auf verschiedenen Markten
Kurse (in US-$) vom 11.10.2010
Marktplatz KursFrankfurt 1348.30
Luxemburg 1347.95London 1348.65Zurich 1348.38Paris 1347.89
10
Aufgaben der Statistik:
• Charakterisierung der Datenreihe durch Kennzahlen
• Grafische Darstellung der Daten
• Eventuell Bereinigung der Daten (Ausreißer etc.)
11
(b) Kursverlaufe von Aktien, Wahrungen, Immobilien:
• Wechselkurs der griechischen Drachme zum Euro
Aufgabe der Statistik:
• Messung der unterschiedlichen Schwankungen
12
94
96
98
100
102
15/12/98 3/07/99 19/01/00 6/08/00
Greek Drachme (GRD / EURO)ERM parity (100): 340.75
24/09/200025/09/2000
-1.5
-1.0
-0.5
0.0
0.5
1.0
15/12/98 3/07/99 19/01/00 6/08/00
Greek Drachme (daily changes in %)24/09/200025/09/2000
(c) Anstieg des ’allgemeinen Preisniveaus’
Wichtige Frage fur die Wirtschaftspolitik:
• Um wieviel Prozent ist das Preisniveau in der BRD im MonatOktober 2010 gegenuber dem Vorjahresmonat gestiegen?
Aufgaben der Statistik:
• Welche Preise sind gemeint?
• Bestimmung eines geeigneten Preisindexes
13
(d) Entwicklung der Arbeitslosigkeit
Wichtige Frage fur die Wirtschaftspolitik:
• Ist die Arbeitslosenquote innerhalb des letzten Monats ge-sunken?
Aufgaben der Statistik:
• Beschaftigungssituation ist jahreszeitlichen Fluktuationenausgesetzt
• Bestimmung der ’Saisonfigur’
• Bereinigung der AL-Quote um die ’Saisonfigur’
14
1.3 Deskriptive und schließende Statistik
Unterteilung der Statistik in 2 Saulen:
• Deskriptive Statistik (Statistik I)(Wie bringe ich die Daten zum Sprechen?)
• Wahrscheinlichkeitsrechnung und induktive Statistik(Was konnen mir die Daten wirklich sagen?)
Weitere gebrauchliche Ausdrucke fur ’induktive Statistik’:
• schließende Statistik
• statistische Inferenz
15
Ziele der induktiven Statistik:
• Datenanalyse auf der Basis von Wahrscheinlichkeitsmodellen
• Verifikation theoretischer Modelle anhand von Daten
Methoden der induktiven Statistik:
• Schatzen von unbekannten Parametern
• Testen von Hypothesen uber unbekannte Parameter
16
Beispiel:
• Die Wirkung von Werbemaßnahmen auf den Absatz von Un-ternehmen
Stichprobe:
• 84 Unternehmen eines bestimmten Sektors in den USA imJahre 1990
17
Stichprobenergebnisse der 84 Unternehmen
18
480
500
520
540
560
0 20 40 60 80 100
Werbeausgaben in Mill. US-$
Abs
atz
in M
ill. U
S-$
Schätzung: Absatz = 502.92 + 0.218 * Werbeausgaben
Offensichtlich:
• ’Hohere Werbeausgaben’ bewirken ’hohere Absatze’(moglicherweise auch umgekehrte Beziehung)
• Zusammenhang ist nicht exakt(vgl. eingezeichnete Regressionslinie)
Theoretisches Modell:
Y = β0 + β1 ·X + Fehler
mit
• Y = Absatz, X = Ausgaben fur Werbung
• β0, β1 unbekannte Parameter
19
Aufgaben der induktiven Statistik:
• ’Gute’ Schatzungen fur die Parameter β0 und β1
• Testen der Hypothese β1 = 0 gegen β1 6= 0(Variable X hat keinerlei Einfluss auf Y
gegen
X hat einen signifikanten Einfluss auf Y )
20
2. Mathematische Grundlagen
Erforderliche mathematische Hilfsmittel:
• Summen und Produkte
• Exponential- und Logarithmusfunktionen
21
2.1 Endliche Summen und Produkte
Betrachte n reelle Zahlen a1, a2, . . . , an ∈ R. Die Summe derZahlen notiert man wie folgt:
a1 + a2 + . . . + an =n
∑
i=1ai =
∑
i∈Iai
Bezeichnungen:
• i heißt Summationsindex
• I = {1, . . . , n} heißt Indexmenge
22
Bemerkungen:
• Die Indexmenge I darf eine beliebige Menge ganzer Zahlensein (I ⊂ Z), z.B. I = {−4,−3,−2,−1,0,1,2,3}. Fur dieSumme gilt dann:
∑
i∈Iai =
3∑
i=−4ai = a−4 + a−3 + a−2 + a−1 + a0 + a1 + a2 + a3
• Die Indexmenge I kann auch leer sein, d.h. I = {}. Fur dieSumme definiert man dann
∑
i∈Iai = 0.
23
Fragen:
• Warum ist das Summenzeichen wichtig?
• Wie kann man formal mit Summen rechnen?
Antworten:
• Das Summenzeichen vereinfacht die Schreibweise in der ge-samten Statistik
• Es gibt Rechenregeln fur Summen, die allesamt formal be-wiesen werden mussen(Aufgabe der Mathematik)
24
Rechenregeln fur endliche Summen: [I]
Dazu seien a1, . . . , an sowie b1, . . . , bn reelle Zahlen
• Mit den beliebigen reellen Zahlen α, β gilt:n
∑
i=1(α · ai + β · bi) =
n∑
i=1α · ai +
n∑
i=1β · bi
= α ·n
∑
i=1ai + β ·
n∑
i=1bi
• Falls a1 = a2 = . . . = an ≡ a, so folgt:n
∑
i=1ai =
n∑
i=1a = n · a
25
Rechenregeln fur endliche Summen: [II]
• Fur jedes (ganzzahlige) m mit 0 ≤ m ≤ n gilt:
n∑
i=1ai =
m∑
i=1ai +
n∑
i=m+1ai
• Fur jedes ganzzahlige m gilt:
n∑
i=1ai =
n+m∑
i=1+mai−m
26
Spezielle endliche Summen: [I]
•n
∑
i=1i = 1 + . . . + n =
n · (n + 1)2
•n
∑
i=1i2 =
n · (n + 1) · (2n + 1)6
•n
∑
i=1i3 =
n2 · (n + 1)2
4
27
Spezielle endliche Summen: [II]
• Es seien a1, b ∈ R, ai = a1 + (i − 1) · b fur i = 2, . . . , n. Dannheißt a1, a2, . . . , an endliche arithmetische Folge 1. Ordnungund es gilt:
n∑
i=1ai =
n2· (2a1 + (n− 1) · b)
• Es seien a1, q ∈ R, ai = a1 · qi−1 fur i = 2, . . . , n. Dann heißta1, a2, . . . , an endliche geometrische Folge und es gilt fur q 6=1:
n∑
i=1ai = a1 ·
qn − 1q − 1
28
Doppelsummen: [I]
• Es sei
a11 a12 · · · a1ma21 a22 · · · a2m... ... . . . ...
an1 an2 · · · anm
eine Matrix (Tabelle) reeller Zahlen
29
Doppelsummen: [II]
• Die Summe uber alle diese Zahlen notiert man als Doppel-summe:
n∑
i=1
m∑
j=1aij = a11 + a12 + . . . + a1m
+ a21 + a22 + . . . + a2m...
+ an1 + an2 + . . . + anm
• Es gilt:n
∑
i=1
m∑
j=1aij =
m∑
j=1
n∑
i=1aij
30
Weiteres Beispiel fur eine Doppelsumme:
n∑
i=1
n∑
j=iaij = a11 + . . . + . . . + . . . + a1n
+ a22 + . . . + . . . + a2n
+ a33 + . . . + a3n
...
+ ann
(Der Laufbereich des 2. Index hangt vom 1. Index ab)
31
Endliche Produkte
Betrachte n reelle Zahlen a1, a2, . . . , an ∈ R. Mit der IndexmengeI = {1,2, . . . , n} notiert man das Produkt der Zahlen wie folgt:
a1 · a2 · . . . · an =n∏
i=1ai =
∏
i∈Iai
Bemerkung:
• Die Indexmenge I kann wiederum leer sein, d.h. I = {}. Furdas Produkt definiert man dann
∑
i∈I ai = 1
32
Rechenregeln fur endliche Produkte:
Es seien a1, . . . , an sowie b1, . . . , bn reelle Zahlen
• Mit den beliebigen reellen Zahlen α, β gilt:
n∏
i=1α · ai · β · bi = αn · βn ·
n∏
i=1ai ·
n∏
i=1bi
• Falls a1 = a2 = . . . = an ≡ a, so folgt:
n∏
i=1ai =
n∏
i=1a = an
33
2.2 Exponentialfunktion und Logarithmus
Zwei wichtige mathematische Funktionen:
• Naturliche Exponentialfunktion
• Naturlicher Logarithmus
Hier:
• Mathematische Definition und Eigenschaften
34
Anwendung in der gesamten Wirtschaftstheorie, z.B.
• in der Wachstumstheorie (VWL)
• in Mikro- und Makromodellen (VWL)
• im gesamten Finance-Bereich (BWL)
• im Operations-Research (BWL)
• in der Statistik / Okonometrie
35
Definition der Exponentialfunktion: [I]
• Betrachte die unendliche Reihe∞∑
k=0
xk
k!= 1 + x +
x2
2+
x3
6+
x4
24+ · · ·
(k! bezeichnet das Produkt der ersten k ganzen Zahlen, alsok! = 1 · 2 · . . . · k)
• Man kann zeigen, dass die Summe fur jedes x ∈ R gegen eineendliche Zahl konvergiert
36
Definition der Exponentialfunktion: [II]
• Fur jedes x ∈ R definiert man
exp(x) =∞∑
k=0
xk
k!
• Die Funktion exp : R → R heißt naturliche Exponentialfunk-tion
37
Eigenschaften der Exponentialfunktion: [I]
• Es gilt:
exp(0) = 1exp(1) = e ≈ 2.71828 (Eulersche Zahl)
• Fur alle x ∈ R gilt:
exp(x) > 0
• Fur alle x ∈ R gilt:
exp′(x) ≡d exp(x)
d x= exp(x)
(Ableitung ist gleich der Funktion selbst)
39
Eigenschaften der Exponentialfunktion: [II]
• Die Funktion exp ist streng monoton wachsend
• Fur beliebige x, y ∈ R gilt die Beziehung:
exp(x + y) = exp(x) · exp(y)
(Funktionalgleichung)
• Fur alle x ∈ R gilt
exp(x) = limn→∞
(
1 +xn
)n
(Aquivalente Darstellung zur Summendefinition)
40
Jetzt:
• Die exp-Funktion besitzt eine eindeutig bestimmte Umkehrfunk-tion
• Diese Umkehrfunktion ist definiert auf (0,∞)
Definition des naturlichen Logarithmus
Die Umkehrfunktion der naturlichen Exponentialfunktion
exp : R→ (0,∞)
heißt naturlicher Logarithmus und wird bezeichnet mit
ln : (0,∞) → R
41
Eigenschaften des naturlichen Logarithmus:
• Die Funktion ln ist streng monoton wachsend
• Fur x > 0 gilt:
ln′(x) =d ln(x)
d x=
1x
• Fur beliebige x, y > 0 gilt die Beziehung
ln(x · y) = ln(x) + ln(y)
(Funktionalgleichung)
43
Weitere Definitionen und Eigenschaften: [I]
• Die allgemeine Potenz ist fur alle x > 0, y ∈ R definiert durch
xy = exp(y · ln(x))
Insbesondere ist fur x ∈ R
ex = exp(x)
• Es sei a > 0 und a 6= 1. Der allgemeine Logarithmus vonx > 0 zur Basis a ist definiert durch
y = loga(x) ⇐⇒ x = ay
44
Weitere Definitionen und Eigenschaften: [II]
• Es gelten die folgenden Beziehungen:
ln(x) = loge(x)
ln(x) = loga(x) · ln(a)
loga(x) =ln(x)ln(a)
• Es sei f : R → (0,∞) eine differenzierbare Funktion. Furjedes x ∈ R heißt die Ableitung
(ln(f(x))′ =d ln(f(x))
d x=
f ′(x)f(x)
die logarithmische Ableitung von f an der Stelle x(auch: stetige Wachstumsrate)
45
3. Merkmale und Daten
Ziel dieses Kapitels:
• Vermittlung des statistischen Grundvokabulars
Zu klarende Begriffe:
• Grundgesamtheit
• Merkmale (Skalenniveau etc.)
• Stichprobe
46
3.1 Grundgesamtheiten
Definition 3.1: (Grundgesamtheit, Merkmalstrager)
Die Grundgesamtheit ist die Gesamtheit aller Einheiten, die statis-tisch untersucht werden sollen. Die Grundgesamtheit ist eineMenge und wird mit G bezeichnet. Ihre Elemente heißen Unter-suchungseinheiten oder Merkmalstrager. Wir schreiben
G = {e1, e2, . . . , en}.
Die Anzahl n der Elemente von G bezeichnet den Umfang derGrundgesamtheit. Wir notieren die Anzahl der Elemente von Gmit |G| = n.
47
Weitere Begriffe:
• Bestandsmasse:GG, die durch einen Zeitpunkt abgegrenzt wird
• Bewegungsmasse:GG, die durch einen Zeitraum abgegrenzt wird
Beispiele fur Bestandsmassen:
• Lagerbestand eines Unternehmens am 31.12.2010
• Handwerksbetriebe im Munsterland am 01.01.2010
48
Beispiele fur Bewegungsmassen:
• Neugegrundete Betriebe in Munster im Jahr 2010
• Studierende an der Uni Munster im WS 2010/2011
Offensichtlich:
• Bestands- und Bewegungsmassen hangen zusammen, undzwar uber die sogenannte Bestandsveranderung
49
3.2 Merkmale
Definition 3.2: (Merkmal, Merkmalsauspragung)
Unter einem Merkmal versteht man eine Eigenschaft der Merk-malstrager, die statistisch untersucht werden soll. Ein Merkmalhat gewohnlich verschiedene Merkmalsauspragungen. Merkmalenotieren wir meist mit Großbuchstaben (X, Y etc.). Merkmal-sauspragungen notieren wir meist mit indizierten griechischenBuchstaben (z.B. ξ1, ξ2 etc.).
50
Bisherige Notationszusammenfassung:
• Merkmalstrager: e1, e2, . . . , en
• Grundgesamtheit: G = {e1, . . . , en}
• Merkmal (interessierende Eigenschaft): X, Y etc.
• Merkmalsauspragungen (Merkmalswerte): ξ1, ξ2, . . .
51
Beispiele:
Grundgesamtheit Merkmal Auspragungen
Haushalte in der verfugbares [0,∞) EuroBRD am 1.1.2010 Monatseinkommen
Studierende der Geschlecht weibl., mannl.WWU am 1.10.2010
52
Typisierungen von Merkmalen: [I]
• Diskrete vs. stetige Merkmale
Ein Merkmal heißt diskret, falls es nur eine ’abzahlbare’Menge von Auspragungen annehmen kann(Vorsicht: ’abzahlbar’ bedeutet nicht endlich!)
Beispiele:
– Typischerweise Zahlmerkmale wie Anzahl von Kindern,Anzahl von Fachsemestern etc.
Ein Merkmal heißt stetig, falls es theoretisch alle reellenZahlen (eines Intervalls) annehmen kann
Beispiele:
– Gewichte, Temperaturen, Preise, Einkommen
53
Typisierungen von Merkmalen: [II]
• Qualitative vs. quantitative Merkmale
Ein Merkmal heißt qualitativ, wenn seine Auspragungendurch verbale Ausdrucke gegeben sind
Beispiele:
– Beruf, Geschlecht, Farbe, Status
Ein Merkmal heißt quantitativ, wenn seine AuspragungenZahlen sind
Beispiele:
– Alter, Einkommen, Noten (falls Note durch Zahl aus-gedruckt wird)
54
Wichtige Frage fur den Statistiker:
• Welche Rechenoperationen sind mit den erhobenen Wertenmoglich?
Antwort uber Skalenniveaus der Daten: [I]
• Nominalskala
Merkmalswerte haben nur Bezeichnungsfunktion(Codes)
Rechenoperationen (Addition, Multiplikation etc.) sindsinnlos
Beispiele: Geschlecht, Religionszugehorigkeit
55
Skalenniveaus: [II]
• Ordinalskala
Es existiert eine naturliche Ordnung der MerkmalswerteGroße der Abstande zwischen den Merkmalswerten ist ir-relevant−→ Rechenoperationen sind sinnlosBeispiele: Klausurnoten, Windstarken
• Intervallskala
Differenzen von je zwei Merkmalswerten konnen sinnvollverglichen werdenFrei wahlbarer MaßstabBeispiel: Temperaturen (in Grad Celsius oder Fahrenheit)
56
Skalenniveaus: [III]
• VerhaltnisskalaBesitzt naturlichen Nullpunkt, aber keine naturliche Mess-einheitBeispiele: Einkommen, Geldmenge(wenn keine Messeinheit vorgegeben ist)
• Absolute SkalaIst eindeutig bestimmt(naturlicher Nullpunkt und naturliche Messeinheit)Beipiele: Einkommen in Euro, Alter in Jahren etc.
Ausdrucksweise:
• Intervall-, Verhaltnis- und absolute Skala werden auch me-trische Skalen genannt
57
3.3 Daten und ihre Erhebung
Begriffserklarung:
• Unter dem Begriff Daten versteht man die beobachtetenWerte eines oder mehrerer Merkmale
Schreibweisen fur Daten:
• Bei einem Merkmal X:
x1, . . . , xn
• Bei 2 Merkmalen X und Y :
(x1, y1), . . . , (xn, yn)
58
Weitere Begriffe: [I]
• Urliste:
Die Gesamtheit aller erhobenen Daten nennt man Urliste
• Haufigkeitsverteilung:
Die Haufigkeitsverteilung gibt fur jeden Merkmalswert dieHaufigkeit an, mit der dieser in den erhobenen Datenvorkommt
Haufigkeitsverteilung (inklusive grafischer Darstellung)ausfuhrlich in Kapitel 4
59
Weitere Begriffe: [II]
• Vollerhebung / Teilerhebung
Vollerhebung: Ermittlung der Merkmalswerte aller Unter-suchungseinheiten der Grundgesamtheit(z.B. Volkszahlung)
Teilerhebung: Auswertung nur eines Teils der Grundge-samtheit
Mogliche Grunde:
– GG ist zu groß (Vollerhebung zu teuer)
– Beobachtung des Merkmals zerstort den Merkmalstra-ger (Qualitatskontrolle)
60
Weitere Begriffe: [III]
• Querschnitte / Zeitreihen / Panels
Querschnitt: Erhebung der Werte eines Merkmals zur sel-ben Zeit an verschiedenen Untersuchungseinheiten(z.B. Umsatze von Unternehmen im Jahre 2002)
Zeitreihen: Erhebung der Werte eines Merkmals an dersel-ben Untersuchungseinheit zu verschiedenen Zeitpunkten(z.B. BSP eines Landes uber verschiedene Jahre)
Panel: Kombination von Querschnitten und Zeitreihen(z.B. Jahrliche Befragung von Haushalten nach ihrem Ein-kommen)
61
3.4 Amtliche und nichtamtliche Statistik
Trager der Wirtschafts- und Sozialstatistik in der BRD:
• Amtliche Statistik
• Nichtamtliche Statistik
Institutionen der amtlichen Statistik:
• Statistisches Bundesamt
• Bundesministerien
• Deutsche Bundesbank
• Bundesanstalten
62
Trager der nichtamtlichen Statistik:
• Unabhangige Wirtschaftswissenschaftliche Institute
IFO (Institut fur Wirtschaftsforschung, Munchen)DIW (Deutsches Institut fur Wirtschaftsforschung, Berlin)IfW (Institut fur Weltwirtschaft, Kiel)RWI (Rheinisch-Westfalisches Institut fur Wirtschaftsfor-schung, Essen)
• Wirtschaftsforschungsinstitute von Interessenverbanden
• Unabhangige, quasi ’halbamtliche’ Institutionen(z.B. Sachverstandigenrat, Monopolkommission)
• Markt-, Meinungs- und Umfrageinstitute
63
4. Auswertung eindimensionaler Daten
Ziel dieses Kapitels:
• Prasentation von Methoden zur statistischen Auswertung eineseinzelnen Merkmals
64
Bezeichnungen (Wiederholung):
• Merkmalstrager: e1, . . . , en
• Grundgesamtheit: G = {e1, . . . , en}
• Zu untersuchendes Merkmal: X
• Mogliche Merkmalswerte: ξ1, . . . , ξJ
• Daten in Urliste: x1, . . . , xn
65
Fragestellungen:
• Formale und grafische Darstellung der Daten
• Berechnung aussagekraftiger Kenngroßen der Daten
Vorgehensweise:
• Vorstellung der statistischen Methoden anhand des Skalen-niveaus des Merkmals X
66
4.1 Beliebig skalierte Daten
Skalenniveau des zu untersuchenden Merkmals X:
• Nominalskala (oder hoher)
Haufigkeiten des Merkmals X mit Auspragungen ξ1, . . . , ξJ:
• Absolute Haufigkeit der Auspragung ξj (j = 1, . . . J):
nj = Anzahl von Daten mit Merkmalswert ξj
• Relative Haufigkeit der Auspragung ξj (j = 1, . . . J):
fj =nj
n= Anteil von Daten mit Merkmalswert ξj
67
Offensichtlich gilt:
• 0 ≤ nj ≤ n sowie∑J
j=1 nj = n (warum?)
• 0 ≤ fj ≤ 1 sowie∑J
j=1 fj = 1 (warum?)
Jetzt:
• Mit den Begriffen der absoluten und relativen Haufigkeitengelangt man zur 1. Darstellungsform des Merkmals X, nam-lich zur Haufigkeitstabelle
68
Definition 4.1: (Haufigkeitstabelle)
Unter der Haufigkeitstabelle des Merkmals X versteht man diefolgende tabellarische Darstellung:
j ξj nj fj = nj/n1 ξ1 n1 f12 ξ2 n2 f2... ... ... ...J ξJ nJ fJSumme: n 1
69
Beispiel (Verkehrsmittelbenutzung):
• Grundgesamtheit bestehe aus 20 Beschaftigten eines Be-triebes, d.h. G = {e1, . . . , e20}
• Zu untersuchendes Merkmal X:Benutztes Verkehrsmittel zum Arbeitsplatz
• Merkmalsauspragungen:
ξ1 = Busξ2 = PKWξ3 = Motorradξ4 = Fahrradξ5 = zu Fuß
70
Erhobene Urliste:
1,1,2,2,2,4,3,5,2,2,5,2,4,1,1,2,2,1,2,1
Haufigkeitstabelle:
j ξj nj fj = nj/n1 Bus 6 6/20 = 0.302 PKW 9 9/20 = 0.453 Motorrad 1 1/20 = 0.054 Fahrrad 2 2/20 = 0.105 zu Fuß 2 2/20 = 0.10
Summe: 20 1.00
71
Man beachte den folgenden ’Trade-Off’:
• Ubergang von Urliste zur Haufigkeitstabelle
erhoht die Ubersichtlichkeit
fuhrt zu einem Informationsverlust
Grafische Darstellungen von Haufigkeitstabellen durch
• Saulendiagramme
• Balkendiagramme
72
Balken- oder Stabdiagramm (absolute Häufigkeiten)
0
2
4
6
8
10
Bus PKW Motorrad Fahrrad zu Fuß
Kuchen- oder Kreisdiagramm (relative Häufigkeiten)
Bus30%
PKW45%
Motorrad5%
Fahrrad10%
zu Fuß10%
Vorsicht bei der Interpretation von Grafiken:
• Grafiken konnen auf viele Weisen manipuliert werden
• Manipulation muss nicht immer schlecht sein
• Verzerren der Achsen
Bestimmte Bereiche werden hervorgehobenBestimmte Bereiche werden unterdruckt
• Skalierungen der Y -Achsen
Bestimmte Entwicklungen werden dramatisiertBestimmte Entwicklungen werden verschwiegen
74
Wichtige Kennzahl einer Datenreihe ist der Modus:
Definition 4.2: (Modus)
Ein Merkmalswert ξj heißt Modus, wenn seine (absolute oderrelative) Haufigkeit mindestens so groß ist wie die aller anderenMerkmalswerte, d.h. wenn nj ≥ nk fur alle k ∈ {1, . . . , J} gilt.
Offensichtlich:
• Eine Datenreihe kann mehrere Modi aufweisen
75
4.2 Mindestens ordinal skalierte Daten
Jetzt:
• Daten seien mindestens ordinal skaliert, d.h. erhobene Datenkonnen sinnvoll geordnet werden
Wichtige Darstellungsform der Daten:
• Empirische Verteilungsfunktion
76
Definition 4.3: (Empirische Verteilungsfunktion)
Gegeben seien die Daten x1, . . . , xn einer Urliste. Fur jede reelleZahl x ∈ R definiert man die empirische Verteilungsfunktionan der Stelle x (in Zeichen: F (x)) als den Anteil der Datenx1, . . . , xn, die kleiner oder gleich x sind:
F (x) =Anzahl aller xi ≤ x
n.
Bemerkung:
• Es gibt alternative Moglichkeiten, die empirische Verteilungs-funktion auszudrucken. Z.B. kann man alle Merkmalsauspra-gungen ξj (j = 1, . . . , J) betrachten, die kleiner oder gleich xsind und deren relative Haufigkeiten fj = nj/n aufsummieren:
F (x) =∑
ξj≤xfj
77
Beispiel (Klausurnoten): [I]
• 16 Studierende erzielten in einer Klausur die folgenden ganz-zahligen Noten:
3,4,2,1,2,4,5,5,2,1,4,5,3,3,2,4
• Zur Berechnung der emp. VF sortieren wir die Urliste vonder kleinsten zur großten Beobachtung
1,1,2,2,2,2,3,3,3,4,4,4,4,5,5,5
78
Beispiel (Klausurnoten): [II]
• Die emp. VF ergibt sich wie folgt:
F (x) =
016 = 0.0000 furx < 1
216 = 0.1250 fur 1 ≤ x < 2
616 = 0.3750 fur 2 ≤ x < 3
916 = 0.5625 fur 3 ≤ x < 4
1316 = 0.8125 fur 4 ≤ x < 5
1616 = 1.0000 furx ≥ 5
79
Bemerkung:
• Wir notieren die vom kleinsten Datenwert (Minimum) zumgroßten Datenwert (Maximum) geordnete Urliste als
x(1) ≤ x(2) ≤ . . . ≤ x(n).
(x(1) = Minimum der Urliste, x(n) = Maximum)
80
0
0,2
0,4
0,6
0,8
1
0 1 2 3 4 5 6
Eigenschaften der empirischen Verteilungsfunktion: [I]
• F (x) = 0 fur alle x < x(1)
• F (x) = 1 fur alle x ≥ x(n)
• F (x) ist eine Treppenfunktion. Sprunge erfolgen an denStellen, die als Daten in der Urliste vorkommen. Die Sprunghohean der Stelle x = ξj betragt fj = nj/n.
• F (x) ist rechtsseitig stetig
• Ist die Urliste sehr lang (d.h. n sehr groß), so wird F (x)immer ’glatter’
81
Eigenschaften der empirischen Verteilungsfunktion: [II]
• Aus F (x) lassen sich die beobachteten Merkmalswerte undderen relativen Haufigkeiten rekonstruieren. Kennt man zu-satzlich noch n, so folgen aus F (x) auch die absoluten Hau-figkeiten
Wichtige Kennzahlen einer Datenreihe:
• Quantile
• Definition der Quantile uber emp. Verteilungsfkt. F (x)
82
Definition 4.4: (p-Quantil)
Gegeben seien die Daten x1, . . . , xn einer Urliste. Man betrachteeine beliebige reelle Zahl p mit 0 < p < 1. Das p-Quantil (oderder p · 100%-Punkt) der Daten (in Zeichen: xp) ist definiert als
xp = min {x ∈ R |F (x) ≥ p}
= kleinstes x ∈ R fur das gilt F (x) ≥ p.
Bemerkung:
• Das p-Quantil xp ist also der kleinste Wert x ∈ R mit derEigenschaft, dass mindestens p ·100% der Daten kleiner odergleich xp sind
83
Bisher:
• Bestimmung von Quantilen uber emp. VerteilungsfunktionF (x)
Jetzt:
• Technische Vorschrift (Algorithmus) zur Bestimmung vonQuantilen aus der Urliste x1, . . . xn (ohne Berechnung deremp. VF F (x))
Betrachte dazu:
• Geordnete Urliste der Daten
x(1) ≤ x(2) ≤ . . . x(n)
84
Das p-Quantil ist dann gegeben durch:
xp =
{
x(n·p), falls n · p ganzzahlig istx(bn·pc+1) sonst
(bn · pc bezeichnet den ganzzahligen Anteil von n · p)
Definition 4.5: (Spezielle Quantile)
Einige p-Quantile haben besondere Namen:
• Median (p = 0.5): x0.5
• Quartile (p = 0.25,0.5,0.75): x0.25, x0.5, x0.75
• Quintile (p = 0.2,0.4,0.6,0.8): x0.2, x0.4, x0.6, x0.8
85
Beispiel (Klausurnoten): [I]
• Urliste (ungeordnet)
x1 x2 x3 x4 x5 x6 x7 x83 4 2 1 2 4 5 5
x9 x10 x11 x12 x13 x14 x15 x162 1 4 5 3 3 2 4
• Geordnete Urliste
x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8)1 1 2 2 2 2 3 3
x(9) x(10) x(11) x(12) x(13) x(14) x(15) x(16)3 4 4 4 4 5 5 5
86
Beispiel (Klausurnoten): [II]
• Berechnung des 0.25-Quantils:
n = 16, p = 0.25 ⇒ n · p = 16 · 0.25 = 4 (ganzzahlig)
⇒ x0.25 = x(n·p) = x(4) = 2
• Berechnung des Medians:
n = 16, p = 0.5 ⇒ n · p = 16 · 0.5 = 8 (ganzzahlig)
⇒ x0.5 = x(n·p) = x(8) = 3
• Berechnung des 0.8-Quantils:
n = 16, p = 0.8 ⇒ n·p = 16·0.8 = 12.8 (nicht ganzzahlig)
⇒ x0.8 = x(bn·pc+1) = x(b12.8c+1) = x(12+1) = x(13) = 4
87
4.3 Metrisch skalierte Daten
Jetzt:
• Metrisch skaliertes Merkmal X (vgl. Folie 29)
• Rechenoperationen mit Daten x1, . . . , xn sinnvoll
Unter dieser Voraussetzung:
• Einfuhrung von Kennzahlen zur Beschreibungder Lage (Abschnitte 4.3.1, 4.3.2)der Streuung (Abschnitt 4.3.3)der Symmetrie (Abschnitt 4.3.6)
der metrisch skalierten Daten x1, . . . , xn
88
4.3.1 Lagemessung
Wichtige Frage der deskriptiven Statistik:
• Beschreibung des ’Lagezentrums’ der erhobenen Datenx1, . . . , xn durch geeignete Kennzahlen(Lagekennziffern, Lagemaße)
Man beachte:
• Je nach Skalenniveau der Daten kommen unterschiedlicheLagemaße in Betracht
89
Beispiele:
• Fur ordinal skalierte Daten kennen wir bereits
den Modus (haufigster Wert einer Datenreihe)den Median (0.5-Quantil, 50%-Wert)
Wichtigstes Lagemaß fur metrisch skalierte Daten:
Definition 4.6: (Arithmetisches Mittel)
Fur die metrisch skalierten Daten x1, . . . , xn ist das arithmetischeMittel (auch: Mittelwert oder Durchschnitt) definiert durch
x =1n· (x1 + x2 + . . . + xn) =
1n
n∑
i=1xi.
90
Eigenschaften des arithmetischen Mittels: [I]
• Arithm. Mittel und Merkmalssummen
∑
i=1xi = n · x = x + x + . . . + x
︸ ︷︷ ︸
n mal
• x liegt zwischen Minimum und Maximum:
x(1) = min{x1, . . . , xn} ≤ x ≤ max{x1, . . . , xn} = x(n)
• Schwerpunkteigenschaft:n
∑
i=1(xi − x) =
n∑
i=1xi − n · x = n · x− n · x = 0
91
Eigenschaften des arithmetischen Mittels: [II]
• Minimumeigenschaft:Fur x gilt:
n∑
i=1(xi − x)2 = min
c∈R
n∑
i=1(xi − c)2
Weitere Berechnungsmoglichkeiten fur x:
• Anhand von relativen bzw. absoluten Haufigkeiten(vgl. Folie 67)
x =1n
n∑
i=1xi =
1n
J∑
j=1ξj · nj =
J∑
j=1ξj · fj
92
Beispiel:
• Grundgesamtheit: n = 520 Haushalte eines Vorortes
• Merkmal: Anzahl der Haushaltsmitglieder
ξj nj1 1882 1733 794 565 206 4
Summe: 520
• Durchschnittliche Haushaltsgroße:
x =1
520· (1 · 188 + 2 · 173 + . . . + 6 · 4) = 2.1519
93
Verallgemeinerung des arithmetischen Mittels:
• Das gewogene arithmetische Mittel:
xw =n
∑
i=1wi · xi
mit den Gewichten w1, . . . , wn, wobei
0 ≤ wi ≤ 1
n∑
i=1wi = 1
94
Bemerkungen:
• Mit w1 = w2 = . . . = wn = 1/n ergibt sich das arithmetischeMittel als Spezialfall
• Das gewogene Mittel ist zu verwenden, falls das relativeGewicht einzelner Untersuchungseinheiten an der Grundge-samtheit von Bedeutung ist. Soll z.B. der durchschnittlicheStrukturwandel in der BRD statistisch erfasst werden, so sindbei der Durchschnittsbildung uber die einzelnen Bundeslanderderen wirtschaftliche Kapazitaten zu berucksichtigen. Z.B.erhalt in der Strukturberichterstattung der gemessene Struk-turwandel in NRW ein hoheres Gewicht als der des Saarlan-des.
95
Arithmetisches Mittel vs. Median
Wiederholung (vgl. Folie 85):
• Median ist 0.5-Quantil
x0.5 =
{
x(n/2), falls n geradex(bn/2c+1), falls n ungerade
Man beachte:
• Sowohl das arithmetische Mittel x als auch der Median x0.5sind populare Lagemaße
96
Vergleich Mittelwert / Median:
• In die Berechnung von x fließen alle Beobacht. ein
Vorteil: Es wird keinerlei Information verschenkt
Nachteil: x reagiert empfindlich auf extreme Ausreißer inden Daten
• x0.5 wird durch Ermittlung der mittleren Position der geord-neten Urliste bestimmt
Vorteil: x0.5 ist robust gegenuber extremen Datenaus-reißern
Nachteil: Es wird Information verschenkt, da nur die Po-sition der Beobachtungen eine Rolle spielt
97
4.3.2 Weitere Mittelwerte
Neben dem (gewogenen) arithmetischen Mittel gibt es eine Reiheweiterer Mittelwerte:
Definition 4.7: (Harmonisches, geometrisches Mittel)
Es seien x1, . . . , xn metrisch skalierte Daten mit xi > 0 fur i =1, . . . , n. Das harmonische Mittel xH sowie das geometrischeMittel xG sind definiert als
xH =1
1n
n∑
i=1
1xi
=
1n
n∑
i=1x−1
i
−1
98
bzw.
xG = n√x1 · x2 · . . . · xn =
n∏
i=1xi
1n
.
Spezielle Anwendungsgebiete:
• Harmonisches Mittel: Indizes vom Typ Paasche(Kapitel 5)
• Geometrisches Mittel: Wachstumsfaktoren und Wachstum-sraten(Kapitel 5)
99
4.3.3 Streuungsmaße
Weitere Frage der dekriptiven Statistik:
• Wie stark streuen die Daten x1, . . . , xn um ein geeignet defi-niertes Zentrum?(Kennzahlen: Streuungs- oder Dispersionsmaße)
Man beachte:
• Mit alternativen Lagemaßen fur das Zentrum ergeben sichunterschiedliche Streuungsmaße
Wichtigste Streuungsmaße fur metrische Daten:
• Varianz und Standardabweichung
100
Definition 4.8: (Varianz, Standardabweichung)
Fur die metrisch skalierten Daten x1, . . . , xn ist die Varianz (inZeichen: s2) definiert durch
s2 =1n·
n∑
i=1(xi − x)2 .
Die Standardabweichung (in Zeichen: s) ist definiert als dieWurzel aus der Varianz, d.h.
s =√
s2 =
√
√
√
√
1n·
n∑
i=1(xi − x)2.
Bemerkung:
• Meist wird bei der Berechnung von s2 bzw. s nicht durch n,sondern durch n− 1 dividiert(Begrundung: in Statistik II)
101
Eigenschaften von s2 und s: [I]
• s2 hat quadratische Dimension, s hat gleiche Dimension wiedie Daten x1, . . . , xn
• Es gilt stets: s2 ≥ 0 und s ≥ 0
• Ferner:
s = 0 ⇐⇒ s2 = 0 ⇐⇒ x1 = x2 = . . . = xn,
d.h. Varianz und Std.Abwch. sind genau dann gleich 0, wennalle Daten gleich sind(keine Streuung)
102
Eigenschaften von s2 und s: [II]
• Alternative Darstellungen:
s2 =1n
n∑
i=1x2
i − x2 (Proseminar)
s2 =1
2n2
n∑
i=1
n∑
j=1
(
xi − xj)2
103
Zwei weitere zentrale Eigenschaften: [I]
• Es seien a, b ∈ R und x1, . . . , xn erhobene Daten eines Merk-mals X. Das Merkmal Y sei eine lineare Transformation vonX, d.h. Y = a ·X + b, so dass fur die Daten des Merkmals Ygilt
yi = a · xi + b fur alle i = 1, . . . , n.
Dann folgt fur die Varianz s2Y bzw. die StandardabweichungsY des Merkmals Y :
s2Y = a2 · s2X bzw. sY = |a| · sX
104
Zwei weitere zentrale Eigenschaften: [II]
• Fur jede reelle Zahl c ∈ R gilt der Verschiebungssatz:
1n
n∑
i=1(xi − c)2 = s2 + (x− c)2
Hieraus folgt die Minimumeigenschaft des arithmetischen Mit-tels (vgl. Folie 92):
”Die durchschnittliche quadratische Abweichung der Datenvon einem Bezugspunkt c wird minimal, wenn man c = xwahlt”
105
Alternative Streuungsmaße: [I]
• Mittlere absolute Abweichung vom Median:
d =1n
n∑
i=1|xi − x0.5|
Es gilt die Minimierungseigenschaft:
d = minc∈R
1n
n∑
i=1|xi − c|
• Quartilsabstand Q
Q = x0.75 − x0.25
(Lange des Bereichs mit mittleren 50% der Daten)
106
Alternative Streuungsmaße: [II]
• Spannweite R
R = maxi=1,...,n
{xi} − mini=1,...,n
{xi} = x(n) − x(1)
(Lange des gesamten Datenbereichs)
Jetzt:
• Berechnung von Streuungsmaßen anhand von Haufigkeiten
Zur Erinnerung (vgl. Folie 67):
• Merkmal X hat die J Auspragungen ξ1, . . . , ξJ mit den jew-eiligen absoluten Haufigkeiten n1, . . . , nJ
107
Damit folgende Formeln fur die Streuungsmaße:
s2 =1n
J∑
j=1
(
ξj − x)2· nj
s =
√
√
√
√
√
1n
J∑
j=1
(
ξj − x)2· nj
d =1n
J∑
j=1
∣
∣
∣ξj − x0.5∣
∣
∣ · nj
R = maxj=1,...,J
{ξj|nj > 0} − minj=1,...,J
{ξj|nj > 0}
108
4.3.4 Additionssatze fur arithmetische Mittel undVarianzen
Ausgangssituation:
• Grundgesamtheit G gliedert sich in K TeilgesamtheitenG1, . . . , GK
• Mittelwerte bzw. Varianzen in den K Teilgesamtheiten sindx1, . . . , xK bzw. s21, . . . , s2K
• Umfange der Teilgesamtheiten seien n1, . . . , nKDamit ist der Umfang der Grundgesamtheit
n =K∑
k=1nk
109
Frage:
• Zusammenhange zwischen dem Mittelwert x bzw. der Vari-anz s2 der Grundgesamtheit und den Mittelwerten bzw. Vari-anzen der Teilgesamtheiten?
Additionssatz fur Mittelwerte:
x =K∑
k=1xk ·
nkn
(Mittelwert der Grundgesamtheit ist gewichtetes Mittel der Mit-telwerte der Teilgesamtheiten)
110
Additionssatz fur Varianzen:
s2 =K∑
k=1s2k ·
nkn
︸ ︷︷ ︸
=s2int
+K∑
k=1(xk − x)2 ·
nkn
︸ ︷︷ ︸
=s2ext
Bedeutung der internen bzw. externen Varianzen s2int, s2ext:
• Interne Varianz ist gewichtetes Mittel aus den Varianzen derTeilgesamtheiten
• Externe Varianz ist gewichtete quadratische Abweichung derMittelwerte xk der K Teilgesamtheiten vom Mittelwert x derGrundgesamtheit
111
Offensichtlich:
• Gesamtvarianz lasst sich exakt in Summe aus interner undexterner Varianz zerlegen:
s2 = s2int + s2ext
Beispiel:
• 100 (Wieder-)Erwerbstatige wurden nach der Dauer X derfruheren Arbeitslosigkeit befragt (in Monaten)
Frauen MannerAnzahl 60 40Mittlere Arbeitslosigkeitsdauer 9.2 7.4Std.-Abwchg. der Arbeitslosigkeitsdauer 4.1 3.2
112
Berechnungen:
x = 9.2 ·60100
+ 7.4 ·40100
= 8.48
s2int = 4.12 ·60100
+ 3.22 ·40100
= 14.182
s2ext = (9.2− 8.48)2 ·60100
+ (7.4− 8.48)2 ·40100
= 0.7776
s2 = s2int + s2ext = 14.182 + 0.7776 = 14.9596
s =√
14.9596 ≈ 3.9
113
4.3.5 Stetig klassierte Daten
Haufiges praktisches Problem:
• Daten liegen nicht als Urliste x1, . . . , xn vor (Einzeldaten),sondern zusammengefasst nach Klassen(stetig klassierte oder Gruppendaten)
Beispiel:
• Verfugbares Monatseinkommen (in Euro) von 5000 Studieren-den
114
j EK-Klasse Kj Studierende nj fjfj
xoj−xu
j1 0 bis 250 300 0.06 0.000242 mehr als 250 bis 500 1000 0.20 0.000803 mehr als 500 bis 750 2000 0.40 0.001604 mehr als 750 bis 1000 1000 0.20 0.000805 mehr als 1000 700 0.14
Summe: 5000 1.00
Grund fur stetige Klassierung:
• Bei sehr langen Datenreihen ist die Angabe von Haufigkeitenjedes einzelnen Datenpunktes oft sinnlos
115
Notationen zur Auswertung stetig klassierter Daten:
• Betrachte die J Klassen (Intervalle)
K1 = [xu1, xo
1], Kj = (xuj , xo
j], j = 2, . . . , J,
wobei fur die Intervallgrenzen gelten soll
xu1 < xo
1 = xu2 < xo
2 = xu3 < xo
3 < . . . < xoJ−1 = xu
J < xoJ
Bemerkungen:Die untere Grenze xu
1 der 1. Klasse kann −∞ seinDie obere Grenze xo
J der J. Klasse kann ∞ sein
• nj ist die Anzahl der Daten in Klasse Kj
• fj =njn ist der Anteil der Daten in Klasse Kj
116
Damit:
• Die Haufigkeitsverteilung der stetig klassierten Daten ist gegebendurch
(K1, n1), (K2, n2), . . . , (KJ , nJ)
bzw. durch
(K1, f1), (K2, f2), . . . , (KJ , fJ)
Bemerkung:
• Es wird nichts uber die Datenverteilung innerhalb der Klassenausgesagt−→ Informationsverlust
117
Probleme bei der stetigen Klassierung:
• Wieviele Klassen J soll man wahlen?Faustregel: Wahle bei n Daten J ≈ 10 · log10 n
• Soll man die J Klassen alle gleich breit wahlen?
• Ist es moglich, die oberste Klasse durch eine endliche Ober-grenze sinnvoll abzuschließen?
118
Definition 4.9: (Empirische Dichte, Histogramm)
Den Quotientennj
n · (xoj − xu
j )=
fj
xoj − xu
j
bezeichnet man als empirische Dichte der Daten in der KlasseKj, j = 1,2, . . . , J. Tragt man die empirischen Dichten als waage-rechte Linien uber den Klassen ab und zeichnet an den Klas-sengrenzen senkrechte Linien in Hohe der jeweiligen emprischenDichten ein, so entsteht ein Histogramm der Daten.
119
Empirische Dichten und Histogramm zum Beispiel ’Studierende’
120
0
0,0004
0,0008
0,0012
0,0016
0,002
0 250 500 750 1000 1250 1500
Bemerkungen zum Histogramm:
• Das Rechteck uber der Klasse j hat die Flache
(xoj − xu
j ) ·fj
xoj − xu
j= fj
• Die Gesamtflache unter dem Histogramm betragt 1, denn
Gesamtflache = Summe der Rechteckflachen
=J
∑
j=1(xo
j − xuj ) ·
fj
xoj − xu
j
=J
∑
j=1fj = 1
121
Jetzt:
• Berechnung statistischer Kenngroßen bei stetig klassiertenDaten
Zunachst:
• Empirische Verteilungsfunktion und Quantile
Erinnerung: (vgl. Folie 77, Definition 4.3)
• Der Wert der emp. Verteilungsfunktion F (x) ist definiert alsAnteil der Daten, die kleiner oder gleich x sind
122
Problem bei stetiger Klassierung:
• Verteilung der Daten in Klasse Kj ist unbekannt
−→ Fur ein x ∈ Kj (x nicht auf der Ober- oder Untergrenze)ist der Anteil nicht bestimmbar
Vorgehensweise:
• Betrachte zunachst die x ∈ R, fur die die emp. Verteilungs-funktion F (x) exakt berechenbar ist
123
Zunachst gilt:
F (x) =
0 fur x < xu1
1 fur x ≥ xoJ
Weiterhin gilt an den Obergrenzen aller Klassen:
F (xoj) =
j∑
r=1fr fur alle j = 1,2, . . . , J
Ubrig bleibt:
• Berechnung von F (x) fur x ∈ (xuj , xo
j]
124
Vorgehensweise:
• Lineare Interpolation von F (x) fur x ∈ (xuj , xo
j]:
F (x) ≈ F (xuj ) +
fj
xoj − xu
j(x− xu
j )
= F (xoj−1) +
fj
xoj − xu
j(x− xu
j )
=j−1∑
r=1fr +
fj
xoj − xu
j(x− xu
j )
125
Beispiel: (vgl. Folien 114, 115) [I]
• Monatseinkommen von 5000 Studierenden
• Obergrenze der letzten Klasse wurde willkurlich auf 1500Euro gesetzt
j EK-Klasse Kj fj F (xoj)
1 0 bis 250 0.06 0.062 mehr als 250 bis 500 0.20 0.263 mehr als 500 bis 750 0.40 0.664 mehr als 750 bis 1000 0.20 0.865 mehr als 1000 bis 1500 0.14 1.00
126
Beispiel: [I]
• Zwischen Klassengrenzen wird linear interpoliert, z.B.
F (650) ≈ f1 + f2 +f3
xo3 − xu
3(x− xu
3)
= 0.26 +0.4
750− 500(650− 500) = 0.5
Empirische Verteilungsfunktion zum Beispiel ’Studierende’
127
0,06
0,26
0,66
0,86
1
0
0,2
0,4
0,6
0,8
1
0 500 1000 1500
x
F(x)
Jetzt:
• Berechnung von Quantilen bei stetiger Klassierung uber em-pirische Verteilungsfunktion F (x)(vgl. Folie 83, Definition 4.4)
Zusatzannahme:
• Keine der Klassen Kj besitzt die Haufigkeit 0
=⇒ Emp. VF F (x) ist streng monoton wachsend=⇒ Fur jedes p ∈ (0,1) hat die Gleichung
F (x) = p
eine eindeutige Losung, namlich das p-Quantil xp
128
Explizite Berechnung von xp: [I]
1. Bestimme die Klasse Kj in der xp liegt,d.h. bestimme das j fur das gilt F (xu
j ) < p ≤ F (xoj)
2. Lose die Gleichung
p = F (xuj ) +
fj
xoj − xu
j(x− xu
j )
nach x auf. Die Losung approximiert das Quantil xp.
129
Explizite Berechnung von xp: [II]
p = F (xuj ) +
fj
xoj − xu
j(x− xu
j )
⇐⇒ x− xuj =
p− F (xuj )
fj(xo
j − xuj )
⇐⇒ x = xuj +
p− F (xuj )
fj(xo
j − xuj )
⇐⇒ x = xuj +
p− F (xuj )
F (xoj)− F (xu
j )(xo
j − xuj )
︸ ︷︷ ︸
≈ xp
130
Beispiel: (vgl. Folie 126, ’Einkommen Studierende’)
• Gesucht: unteres Quartil x0.25
Berechnung von x0.25:
1. 0.06 = F (xu2) < 0.25 ≤ 0.26 = F (xo
2),
d.h.
x0.25 ∈ K2 = (250,500]
2. Damit folgt:
x0.25 ≈ 250 +0.25− 0.060.26− 0.06
(500− 250) = 487.5
131
Es verbleibt:
• Berechnung weiterer statistischer Kennzahlen, z.B.
Arithmetisches Mittel
Varianz bzw. Standardabweichung
(Nicht in der VL)
132
4.3.6 Schiefemessung
Situation:
• Betrachte Urliste x1, . . . , xn (keine stetige Klassierung)
Wichtige praktische Feststellung:
• In der empirischen Wirtschaftsforschung werden Kennzahlenwie arithmetisches Mittel, Varianz, Standardabweichung etc.in der Praxis nicht per Hand ausgerechnet, sondern mit spe-zieller Auswertungssoftware (z.B. EViews)
133
Beispiel: (vgl. Folie 12)
• Tagliche Wechselkursveranderungsraten der griechischenDrachme zum Euro
Stabdiagramm und statistische Kennzahlen fur GRD-Veranderungsraten
134
0
100
200
300
400
500
-1.0 -0.5 0.0 0.5
Series: GRD_RETSample 16/12/1998 1/01/2001Observations 748
Mean 0.005082Median 0.000000Maximum 0.817738Minimum -1.295992Std. Dev. 0.114130Skewness -1.693633Kurtosis 38.21140
Jarque-Bera 38999.36Probability 0.000000
0
100
200
300
400
500
600
-4 -3 -2 -1 0 1 2 3
Series: SYMMETRIESample 1 5000Observations 5000
Mean -0.007964Median 0.004551Maximum 3.433310Minimum -3.982642Std. Dev. 0.994190Skewness -0.019422Kurtosis 2.939408
Jarque-Bera 1.079224Probability 0.582974
Symmetrische Verteilung
0
100
200
300
400
500
600
0.0 0.1 0.2 0.3 0.4 0.5 0.6
Series: RECHTSSample 1 5000Observations 5000
Mean 0.168041Median 0.150735Maximum 0.661654Minimum 0.002084Std. Dev. 0.102757Skewness 0.865684Kurtosis 3.650617
Jarque-Bera 712.6960Probability 0.000000
Rechtsschiefe Verteilung
0
100
200
300
400
500
600
0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Series: LINKSSample 1 5000Observations 5000
Mean 0.830835Median 0.851905Maximum 0.996949Minimum 0.280793Std. Dev. 0.104683Skewness -0.896282Kurtosis 3.619218
Jarque-Bera 749.3160Probability 0.000000
Linksschiefe Verteilung
Fazit:
• Datenreihen zeigen unterschiedliches Symmetrieverhalten
Jetzt:
• Kennzahl fur Symmetrieverhalten
136
Definition 4.10: (Schiefe)
Die Schiefe einer Urliste x1, . . . , xn ist definiert durch
g =1n
n∑
i=1
(xi − xs
)3,
wobei wie ublich
x =1n
n∑
i=1xi
und
s =
√
√
√
√
1n
n∑
i=1(xi − x)2
das arithmetische Mittel sowie die Standardabweichung der Datenbezeichnen.
137
Bemerkungen:
• Der zentrale Term in Definition 4.10 ist∑n
i=1(xi − x)3
• Liegen ’viele’ Daten xi rechts von x, so ist g tendenziell posi-tiv
• Liegen ’viele’ Daten xi links von x, so ist g tendenziell negativ
• Insgesamt gelten die folgenden Relationen:
g < 0 =⇒Verteilung ist linksschiefg ≈ 0 =⇒Verteilung ist symmetrischg > 0 =⇒Verteilung ist rechtsschief
138
5. Verhaltniszahlen, Messzahlen und Indexzahlen
Ziel dieses Kapitels:
• Grundlegende Maßzahlen der praktischen Wirtschaftsstatistik
5.1 Verhaltniszahlen
Definition 5.1: (Verhaltniszahl)
Eine Verhaltniszahl ist allgemein der Quotient zweier statistis-cher Großen. Die den beiden Großen zugrunde liegenden Grund-gesamtheiten konnen identisch oder verschieden sein. Als spezi-elle Verhaltniszahlen unterscheidet man Gliederungszahlen, Be-ziehungszahlen und Messzahlen.
139
Gliederungszahl:
• Aussage uber die Struktur der Grundgesamtheit G eines (me-trisch skalierten) Merkmals U
• Annahme: G zerfallt in J Teilgesamtheiten, d.h.
G = G1 ∪G2 ∪ . . . ∪GJ
• Es bezeichne uj die Merkmalssumme von U in der Teilge-samtheit Gj (j = 1, . . . , J), so dass gilt
u =J
∑
r=1ur = Merkmalssumme von U auf ganz G
• Definiere nun fur j = 1, . . . , J die Gliederungszahlen
gj =uj
u
140
Bemerkungen:
• Die Gliederungszahlen gj sind Anteile, d.h. es gilt
gj ≥ 0∑J
r=1 gr = 1
Beispiele:
• Anteile der Studierenden der unterschiedlichen Disziplinenam Fachbereich WiWi der WWU(Betriebs-, Volkswirte, Wirtschaftsinformatiker)
• Anteile von Bund, Landern und Kommunen an der Gesamtver-schuldung der BRD
141
Beziehungszahl: [I]
• Aussage uber die Struktur der Grundgesamtheit G in Bezugauf 2 (metrisch skalierte) Merkmale U und V
• Annahme: G zerfallt in J Teilgesamtheiten, d.h.
G = G1 ∪G2 ∪ . . . ∪GJ
• Es bezeichnen uj und vj die Merkmalssummen von U und Vin der Teilgesamtheit Gj (j = 1, . . . , J), so dass gilt
u =J
∑
r=1ur = Merkmalssumme von U auf ganz G
v =J
∑
r=1vr = Merkmalssumme von V auf ganz G
142
Beziehungszahl: [II]
• Definiere nun die Beziehungszahlen
b =uv
bzw. fur j = 1, . . . , J
bj =uj
vj
Beispiel: (Bundeslanderstatistik)
• Amtliche Statistik der BRD
143
Bundesland Einw. in 1000 BIP (Mrd. DM)Baden-Wurttemberg 10397 520.36Bayern 12066 614.97Berlin 3426 154.81Brandenburg 2573 75.72Bremen 674 40.34Hamburg 1705 141.25Hessen 6032 340.91Meck.-Vorpommern 1808 47.91Niedersachsen 7845 315.75NRW 17975 799.51Rheinland-Pfalz 4018 156.04Saarland 1081 43.92Sachsen 4522 124.08Sachsen-Anhalt 2702 69.71Schleswig-Holstein 2757 113.79Thringen 2478 64.93Summe 82059 3624.00
144
Gliederungszahlen: (vgl. Folie 146)
• Bevolkerungsanteil
• Anteil am BIP
Beziehungszahlen: (vgl. Folie 147)
• BIP pro Kopf
145
Bundesland Bev.-Anteil Anteil am BIPBaden-Wurttemberg 0.1267 0.1436Bayern 0.1470 0.1697Berlin 0.0418 0.0427Brandenburg 0.0314 0.0209Bremen 0.0082 0.0111Hamburg 0.0208 0.0390Hessen 0.0735 0.0941Meck.-Vorpommern 0.0220 0.0132Niedersachsen 0.0956 0.0871NRW 0.2190 0.2206Rheinland-Pfalz 0.0490 0.0431Saarland 0.0132 0.0121Sachsen 0.0551 0.0342Sachsen-Anhalt 0.0329 0.0192Schleswig-Holstein 0.0336 0.0314Thringen 0.0302 0.0179Summe 1 1
146
Bundesland BIP pro Kopf in DMBaden-Wurttemberg 50049.05Bayern 50967.18Berlin 45186.81Brandenburg 29428.68Bremen 59851.63Hamburg 82844.57Hessen 56516.91Meck.-Vorpommern 26498.89Niedersachsen 40248.57NRW 44479.00Rheinland-Pfalz 38835.24Saarland 40629.05Sachsen 27439.19Sachsen-Anhalt 25799.41Schleswig-Holstein 41273.12Thringen 26202.58Deutschland insgesamt 44163.35
147
Einige Zusammenhange: [I]
• Es gilt:
b =uv
=1v
J∑
j=1uj =
J∑
j=1
uj
v
=J
∑
j=1
vj
v·uj
vj
=J
∑
j=1hj ·
uj
vj
−→ Beziehungszahl b = uv ist gewogenes arithmetisches Mittel
der Beziehungszahlenujvj
mit den Gewichten hj =vjv
148
Einige Zusammenhange: [II]
• Ferner gilt:
b =(v
u
)−1=
∑Jj=1 vj
u
−1
=
J∑
j=1
uj
u·vj
uj
−1
=
J∑
j=1gj
(
uj
vj
)−1
−1
=1
∑Jj=1 gj · 1
bj
−→ b = uv ist gewogenes harmonisches Mittel der bj =
ujvj
mit den
Gewichten gj =uju
149
Messzahl:
• Quotient zweier sachlich aufeinander bezogener Maßzahlenfur zwei statistische Massen
Beispiele: [I]
• Geschlechterverhaltnis
Geschl.-Verhaltn. =Manner in der BRD am 1.1.2010Frauen in der BRD am 1.1.2010
(Messzahl des sachlichen Vergleichs)
150
Beispiele: [II]
• Einwohnerrelation zwischen 2 Landern
Einwohnerel. =Einwohner der BRD am 1.1.2010
Einwohner Frankreichs am 1.1.2010(Messzahl des raumlichen Vergleichs)
• Einwohnerrelation eines Landes an 2 Zeitpunkten
Einwohnerel. =Einwohner der BRD am 1.1.2010Einwohner der BRD am 1.1.2005
(Messzahl des zeitlichen Vergleichs)
151
5.2 Messzahlen des zeitlichen Vergleichs
Ausgangssituation und Begriffe: [I]
• Betrachte eine zeitlich geordnete Folge von Zeitpunkten t0 ≤t1 ≤ . . . ≤ tT sowie die Auspragungen eines (metrischen)Merkmals X zu diesen Zeitpunkten:
xt0, xt1, . . . , xtT
(alternative Schreibweise: xt, t = t0, . . . , tT )
• Der Index t steht fur die Zeit (time). Deshalb nennt man dieobige Urliste xt0, . . . , xtT eine Zeitreihe
152
Ausgangssituation und Begriffe: [II]
• Sind die Abstande zwischen den Zeitpunkten t0, t1, . . . , tT im-mer gleich, d.h.
t1 − t0 = t2 − t1 = . . . = tT − tT−1,
so spricht man von aquidistanten Zeitpunkten. In diesemFall benennt man die Zeitpunkte t0, t1, . . . , tT der Einfachheithalber um in 0,1, . . . , T und notiert die obige Zeitreihe als
x0, x1, . . . , xT
Beispiele fur Zeitreihen:
• Monatliche Arbeitslosenquoten
• Tagliche Wechselkurse zwischen Euro und US-$
153
Haufiges Vorgehen in der Empirischen Wirtschaftsforschung:
• Wahle aus der Menge aller moglichen Zeitpunkte einen Ba-siszeitpunkt s ∈ {t0, . . . , tT} und setze die gesamte Zeitreihext, t = t0, . . . , tT , ins Verhaltnis zur Beobachtung xs des Ba-siszeitpunktes. Fur einen beliebigen Berichtszeitpunkt t be-trachtet man also den Quotienten
ms,t =xt
xsfur t = t0, . . . , tT
• Begrundung:Man interessiert sich fur die Entwicklung der Zeitreihe relativzur Auspragung des Basiszeitpunktes s(in praxi wird oft s = t0 gewahlt)
154
Definition 5.2: (Messzahl mit fester Basiszeit)
Fur einen konkreten Basiszeitpunkt s ∈ {t0, . . . , tT} nennt manden Quotienten
ms,t =xt
xs
die Messzahl fur die Berichtszeit t.
Man beachte:
• Aus Definition 5.2 folgt unmittelbar:
mt,t = 1
ms,t =xt
xs=
1xs/xt
=1
mt,s
155
Beispiel:
• Wechselkurszeitreihe ’Griechische Drachme zum Euro’(Tagesdaten)
Offensichtlich:
• Qualitativer Verlauf gleich
• Untere Grafik betont Kursverlauf relativ zum Startwert
156
320
325
330
335
340
345
15/12/98 3/07/99 19/01/00 6/08/00
Originale Zeitreihe
0.96
0.98
1.00
1.02
1.04
15/12/98 3/07/99 19/01/00 6/08/00
Zeitreihe zum Basiszeitpunkt s=0 (Basiswert: 328.388)
5.2.1 Umbasierung und Verkettung von Mess-zahlen
Definition 5.3: (Umbasierung)
Unter der Umbasierung einer Messzahl zum Basiszeitpunkt s ver-steht man den Ubergang zu einer Messzahl mit anderer Basiszeitr ∈ {t0, . . . , tT}.
Rechenregel fur Umbasierung: [I]
• Offensichtlich gilt fur jedes t ∈ {t0, . . . , tT}
mr,t =xt
xr=
xt/xs
xr/xs=
ms,t
ms,r
158
Rechenregel fur Umbasierung: [II]
−→ Zirkularitat von Messzahlen:
ms,t = ms,r ·mr,t
Verkettung von Messzahlen:
• Betrachtete aquidistante Zeitreihe x0, x1, . . . , xT und Folgenvon Messzahlen zu den Basiszeiten 0 bzw. s
m0,t fur t = 0,1, . . . , sms,t fur t = s, s + 1, . . . , T
• Gesucht: durchgehende (vollstandige) Folgen von Messzahlenzu den Basiszeiten 0 bzw. s
159
Losung:
• Messzahlenfolge fur die Basiszeit 0:
m0,t =
{
m0,t fur t = 0,1, . . . , sm0,s ·ms,t fur t = s + 1, s + 2, . . . , T
• Messzahlenfolge fur die Basiszeit s:
ms,t =
m0,tm0,s
fur t = 0,1, . . . , s− 1
ms,t fur t = s, s + 1, . . . , T
Zahlenbeispiel:
• In den Tutorien
160
5.2.2 Zuwachsraten und Zuwachsfaktoren
Betrachte:
• Aquidistante Zeitreihe xt, t = 0,1, . . . , T
• Messzahl mit fester Basiszeit
ms,t =xt
xs
(vgl. Definition 5.2, Folie 155)
161
Definition 5.4: (Zuwachsfaktor, Zuwachsrate)
Die Messzahl ms,t bzeichnet man auch als Zuwachsfaktor bzw. alsWachstumsfaktor. Die absolute Anderung xt − xs bezogen aufden Wert zur Zeit s
ws,t =xt − xs
xs= ms,t − 1
bezeichnet man als Zuwachsrate bzw. Wachstumsrate.
Bemerkungen:
• Zuwachsfaktoren und -raten werden oft in Prozent angegeben
• Es gilt
xt = ms,t · xs bzw. xt − xs = ws,t · xs
162
Beispiel:
• Bargeldumlauf in der BRD
Jahr Umlauf Zuwachsfaktor Zuwachsrate(in Mio. DM) (in Prozent)
1992 2272851993 238641 1.04996 4.9961994 250907 1.05140 5.1401995 263510 1.05023 5.0231996 275744 1.04643 4.6431997 276242 1.00181 0.1811998 270981 0.98096 −1.9041999 289972 1.07008 7.0082000 278143 0.95921 −4.0792001 162205 0.58317 −41.683
163
Definition 5.5: (Durchschnittlicher Zuwachsfaktor)
Als durchschnittlichen Zuwachsfaktor zwischen Anfangs- undEndzeitpunkt bezeichnet man das geometrische Mittel (vgl. Def-inition 4.7, Folie 98) der 1-periodigen Zuwachsfaktoren:
mG = T√
m0,1 ·m1,2 · . . . ·mT−1,T .
Bemerkungen: [I]
• Es gilt:
mG = T√
m0,1 ·m1,2 · . . . ·mT−1,T
= T
√
x1
x0·x2
x1·x3
x2· . . . ·
xT−1
xT−2·
xTxT−1
= T
√
xTx0
(Durchschnittl. Zuwachsfaktor hangt nur von x0 und xT ab)
164
Bemerkungen: [II]
• Wenn x0 jede Periode um den durchschnittlichen Zuwachs-faktor steigt, ergibt sich nach T Perioden xT :
t = 0 : x0
t = 1 : x0 ·mG
t = 2 : x0 ·mG ·mG = x0 ·m2G
... ...
t = T : x0 ·mTG = x0 ·
(
T
√
xTx0
)T= xT
165
Definition 5.6: (Durchschnittliche Zuwachsrate)
Als durchschnittliche Zuwachsrate bezeichnet man den um 1 ver-minderten durchschnittlichen Zuwachsfaktor:
w = mG − 1 = T
√
xTx0
− 1.
166
5.2.3 Logarithmische Zuwachsraten
Definition 5.7: (Logarithmische Zuwachsrate)
Unter der logarithmischen Zuwachsrate (auch stetige Zuwach-srate) zwischen den Zeitpunkten s, t versteht man die Große
rs,t = ln(xt
xs
)
= ln(xt)− ln(xs).
Bemerkungen: [I]
• Es gilt:
xt = xs · ers,t
167
Bemerkungen: [II]
• Zwischen der log. Wachstumsrate rs,t und der Zuwachsratews,t aus Definition 5.4 gilt in ’guter’ Naherung:
rs,t = ln(xt)− ln(xs) ≈xt − xs
xs= ws,t
Vorteile der logarithmischen Wachtumsrate: [I]
• Addierbarkeit:
r0,T = ln(xT )− ln(x0) =T
∑
t=1
[
ln(xt)− ln(xt−1)]
=T
∑
t=1rt−1,t
(Wachstumsrate r0,T ist Summe der 1-periodigen Wachs-tumsraten rt−1,t)
168
Vorteile der logarithmischen Wachtumsrate: [II]
−→ Durchschnittliche logarithmische Zuwachsrate r zwischen denZeitpunkten 0 und T ist arithmetisches Mittel der 1-periodigenlogarithmischen Wachstumsraten
r =1T·
T∑
t=1rt−1,t =
1T· r0,T
• ’Symmetrie’:Verandert sich der Wert xt in der Folgeperiode t+1 auf xt+1und fallt dann in t+2 auf xt zuruck (also xt+2 = xt), so sinddie log. Wachstumsraten rt,t+1 und rt+1,t+2 vom Betrage hergleich (mit entgegengesetzen Vorzeichen)
169
Beispiel: Symmetrische Aktienkursbewegung
Periode Kurs rt,t+1 wt,t+1t 100
t + 1 110 0.0953 0.1t + 2 100 −0.0953 −0.0909
Summe: 0 0.0091
Anwendungsgebiete der log. Zuwachsrate:
• Finanzmathematik (stetige Verzinsung)
• Finanzmarkte (Aktien- und Wechselkursanderungen)
• Modelle der Wachstums- und Konjunkturtheorie
170
5.3 Indexzahlen
Bisher:
• Zeitliche Entwicklung einer okonomischen Große uber Mess-zahlen
Jetzt:
• Zeitliche Entwicklung mehrerer Großen gleichzeitig
171
Beispiele:
• Preisentwicklung fur Guter des privaten Konsums
Problem:Preise einiger Guter steigen, Preise anderer Guter fallen
−→ Aggregation aller Messzahlen zu einer Indexzahl (Index)
• Aktienindizes (DAX, Dow Jones, Euro Stoxx)
Aggregation von Kursen verschiedener Aktien zu einemAktienkorb
Ziel:Darstellung der Entwicklung des Gesamtmarktes
172
Voraussetzungen und Notationen:
• Betrachte einen Warenkorb (Kollektion von Gutern)
• Jedes Gut des Korbes hat einen Preis und eine Menge
• n: Anzahl der Guter im Warenkorb
• pt(i): Preis des Gutes i zur Zeit t
• qt(i): Menge des Gutes i zur Zeit t
• vt(i) = pt(i) · qt(i): Wert des Gutes i zur Zeit t
173
Benennungen:
• Preise: GeldeinheitenMengeneinheit (z.B. 1 Euro / Liter)
• Mengen: Mengeneinheiten
• Wert: Geldeinheiten
Betrachtung zweier Zeitpunkte:
• Berichtszeit (notiert mit t)
• Basiszeit (Setzung auf 0)
174
Generelles Ziel:
• Beschreibung der Veranderungen von Preisen, Mengen undWerten des gesamten Warenkorbes zwischen der Berichtszeitt und dem Basiszeitpunkt 0
Zunachst fur einzelnes Gut i (i = 1, . . . , n):
• pt(i)p0(i)
: Preismesszahl fur das Gut i
• qt(i)q0(i)
: Mengenmesszahl fur das Gut i
• vt(i)v0(i)
: Wertmesszahl fur das Gut i
175
Offensichtlich:
vt(i)v0(i)
=pt(i) · qt(i)p0(i) · q0(i)
=pt(i)p0(i)
·qt(i)q0(i)
(Wertmesszahl = Preismesszahl × Mengenmesszahl)
Bisher:
• Anderungen des Warenkorbes durch 3 · n Messzahlen
Jetzt:
• Aggregation einzelner Messzahlen zu Indexzahlen
176
5.3.1 Preisindizes
Ziel:
• Indexzahlen zur Messung der Preisentwicklung
Definition 5.8: (Laspeyres-Preisindex)
Die Mittelwertform des Preisindexes vom Typ Laspeyres ist defi-niert durch
IpLa;0,t =
n∑
i=1
pt(i)p0(i)
·p0(i) · q0(i)
∑nj=1 p0(j) · q0(j)
.
177
Bemerkungen: [I]
• In seiner Mittelwertform ist der Preisindex IpLa;0,t ein gewo-
genes arithmetisches Mittel der Preismesszahlen
pt(i)p0(i)
, i = 1, . . . , n.
• Die Gewichtep0(i) · q0(i)
∑nj=1 p0(j) · q0(j)
sind die Ausgabenanteile fur jedes einzelne Gut i zum Ba-siszeitpunkt 0
178
Bemerkungen: [II]
• Durch Kurzen von p0(i) ergibt sich die Aggregatform desLaspeyres-Indexes:
IpLa;0,t =
∑ni=1 pt(i) · q0(i)
∑ni=1 p0(i) · q0(i)
Definition 5.9: (Paasche-Preisindex)
Die Mittelwertform des Preisindexes vom Typ Paasche ist definiertdurch
IpPa;0,t =
1n
∑
i=1
1pt(i)p0(i)
·pt(i) · qt(i)
∑nj=1 pt(j) · qt(j)
.
179
Bemerkungen: [I]
• In seiner Mittelwertform ist der Preisindex IpPa;0,t ein gewo-
genes harmonisches Mittel der Preismesszahlen
pt(i)p0(i)
, i = 1, . . . , n.
• Die Gewichtept(i) · qt(i)
∑nj=1 pt(j) · qt(j)
sind die Ausgabenanteile fur jedes einzelne Gut i zum Bericht-szeitpunkt t
180
Bemerkungen: [II]
• Durch Umformung des Doppelbruchs ergibt sich die Aggre-gatform des Paasche-Indexes:
IpPa;0,t =
∑ni=1 pt(i) · qt(i)
∑ni=1 p0(i) · qt(i)
Beispiel: [I]
• Warenkorb mit n = 3 Gutern
Gut Basiszeit t = 0 Berichtszeit t = 1i p0(i) q0(i) p1(i) q1(i)1 14.30 2.20 14.70 1.802 1.19 8.00 1.05 18.003 0.94 18.00 0.99 14.00
181
Beispiel: [II]
• Arbeitstabelle zur Indexberechnung in Aggregatform
i p1(i) · q0(i) p0(i) · q0(i) p1(i) · q1(i) p0(i) · q1(i)1 32.34 31.46 26.46 25.742 8.40 9.52 18.90 21.423 17.82 16.92 13.86 13.16∑
58.56 57.90 59.22 60.32
• Berechnung der Indizes:
IpLa,0,t =
58.5657.90
= 1.0114, IpPa,0,t =
59.2260.32
= 0.9818
182
Offensichtliches Dilemma:
• Laspeyres-Index zeigt Preiserhohung an, Paasche-Index dage-gen Preissenkung
Frage:
• Wie hangen die beiden Indizes zusammen?
183
Mathematisches Resultat:
• Es gilt
IpPa,0,t < Ip
La,0,t
genau dann, wenn die beiden Folgen der Preis- und Mengen-messzahlen (fur i = 1, . . . , n)
pt(i)p0(i)
undqt(i)q0(i)
’negativ korreliert’ sind(Zum Begriff der Korrelation, vgl. Kapitel 6)
Jetzt:
• Ein letzter Preis-Index-Typ
184
Definition 5.10: (Fisher-Preisindex)
Der Preisindex vom Typ Fisher ist definiert durch
IpF i;0,t =
√
IpLa;0,t · I
pPa;0,t.
Bemerkungen:
• Fisher-Index ist geometrisches Mittel aus Laspeyres- undPaasche-Index
• Es gilt:
min{
IpLa;0,t, I
pPa;0,t
}
≤ IpF i;0,t ≤ max
{
IpLa;0,t, I
pPa;0,t
}
• Fur das obige Warenkorbbeispiel gilt:
IpF i;0,t =
√1.0114 · 0.9818 = 0.9965
(Preisreduktion des Warenkorbes um 0.35%)
185
5.3.2 Mengenindizes
Jetzt:
• Ubertragung des Konzeptes der Preisindizes auf Mengenin-dizes durch einfache Vertauschung der Rollen von Preisenund Mengen
186
Definition 5.11: (Mengenindizes)
Die Mittelwert- bzw. Aggregatformen des(a) Mengenindexes nach Laspeyres sind definiert durch
IqLa;0,t =
n∑
i=1
qt(i)q0(i)
·p0(i) · q0(i)
∑nj=1 p0(j) · q0(j)
=∑n
i=1 qt(i) · p0(i)∑n
i=1 q0(i) · p0(i),
(b) Mengenindexes nach Paasche sind definiert durch
IqPa;0,t =
1n
∑
i=1
1qt(i)q0(i)
·pt(i) · qt(i)
∑nj=1 pt(j) · qt(j)
=∑n
i=1 qt(i) · pt(i)∑n
i=1 q0(i) · pt(i).
(c) Der Mengenindex nach Fisher ist definiert durch
IqF i;0,t =
√
IqLa;0,t · I
qPa;0,t.
187
5.3.3 Wertindizes
(Kanonische) Definition eines Wertindexes:
• Man beachte hierbei, dass die Werte des Warenkorbes zu denZeitpunkten 0 bzw. t gegeben sind durch
n∑
i=1v0(i) =
n∑
i=1p0(i) · q0(i) bzw.
n∑
i=1vt(i) =
n∑
i=1pt(i) · qt(i)
Definition 5.12: (Wertindex)
Ein geeigneter Wertindex ist in naturlicher Weise definiert durch
Iv0,t =
∑ni=1 vt(i)
∑ni=1 v0(i)
=∑n
i=1 pt(i) · qt(i)∑n
i=1 p0(i) · q0(i).
188
Bemerkungen:• Strukturell analog zu den Preis- und Mengenindizes konnte
man Wertindizes vom Typ Laspeyeres, Paasche bzw.Fisher definieren als
IvLa;0,t =
n∑
i=1
vt(i)v0(i)
·v0(i)
∑nj=1 v0(j)
IvPa;0,t =
1n
∑
i=1
1vt(i)v0(i)
·vt(i)
∑nj=1 vt(j)
IvF i;0,t =
√
IvLa;0,t · I
vPa;0,t
• Man uberpruft leicht, dass gilt:
IvLa;0,t = Iv
Pa;0,t = IvF i;0,t = Iv
0,t
189
5.3.4 Umbasierung und Verkettung von Indizes
Jetzt:
• Umbasierung und Verkettung beliebiger Indizes (Preis, Menge,Wert) in Analogie zur Umbasierung und Verkettung von Mess-zahlen(vgl. Folien 158, 159)
190
Definition 5.13: (Umbasierung von Indizes)
Gegeben sei eine Folge von Indizes zur Basiszeit s:
I∗s,t, t = t0, t1, . . . , tT .
Eine Folge von Indizes Ir,t zu einer alternativen Basiszeit r ∈{t0, t1, . . . , tT}, r 6= s, erhalt man durch
Ir,t =I∗s,tI∗s,r
, t = t0, t1, . . . , tT .
191
Definition 5.14: (Verkettung von Indizes)
Gegeben seien zwei Folgen von Indizes zu aquidistanten Zeiten:
I∗0,t fur t = 0,1, . . . , s,
I∗∗s,t fur t = s, s + 1, . . . , T.
Als verkettete Folge zur Basiszeit 0 verwendet man
I0,t =
{
I∗0,t fur t = 0,1, . . . , sI∗0,s · I
∗∗s,t fur t = s + 1, . . . , T
.
Durch Umbasierung der Indizes I∗0,t erhalt man die verketteteFolge zur Basiszeit s:
Is,t =
I∗0,tI∗0,s
fur t = 0,1, . . . , s− 1
I∗∗s,t fur t = s, s + 1, . . . , T.
192
Problem:
• Umbasierung und Verkettung von Indizes ist im allgemeinennicht typerhaltend
Beispiel: [I]
• Umbasierung des Laspeyres-Preisindexes IpLa;91,t vom Basiszeit-
punkt 91 auf Basiszeitpunkt 95
193
Beispiel: [II]
• Fur den Berichtszeitpunkt t = 96 ergibt sich:
I95,96 =IpLa;91,96
IpLa;91,95
=
∑ni=1 p96(i) · q91(i)
∑ni=1 p91(i) · q91(i)
∑ni=1 p95(i) · q91(i)
∑ni=1 p91(i) · q91(i)
=∑n
i=1 p96(i) · q91(i)∑n
i=1 p95(i) · q91(i)
6=∑n
i=1 p96(i) · q95(i)∑n
i=1 p95(i) · q95(i)= Ip
La;95,96
194
5.3.5 Formale Indexkriterien (Fisher-Proben)
Offensichtlich:
• Es gibt mehrere Indizes fur ein Messproblem
Frage:
• Welcher Index ist der ’beste’?
Losungsmoglichkeit:
• Postuliere ’sinnvolle’ Kriterien, die ein Index erfullen sollte
195
Vorschlag von I. Fisher (1922): [I]
• Ein Index Is,t (zur Basiszeit s und Berichtszeit t) sollte diefolgenden 7 Kriterien erfullen:
(1) Identitatsprobe
It,t = 1
(2) Zeitumkehrprobe
It,0 =1
I0,t
(3) Rundprobe (fur die Zeitpunkte t1, t2, . . . , tT )
It1,tT = It1,t2 · It2,t3 · . . . · ItT−1,tT
196
Vorschlag von I. Fisher (1922): [II](4) Faktorumkehrprobe
Iv0,t = Ip
0,t · Iq0,t
(5) Proportionalitatsprobe
Ip0,t = 1 + α,
wenn alle Preise um α · 100% steigen
(6) DimensionswechselsprobeDer Wert der Indizes hangt nicht davon ab, in welchen Ein-heiten Preise und Mengen gemessen werden
(7) BestimmtheitsprobeDer Index soll auch dann bestimmt sein, wenn einzelne Preiseoder Mengen gleich 0 sind
197
Frage:
• Welche Kriterien (Fisherproben) erfullen die alternativen In-dizes vom Typ Laspeyres, Paasche, Fisher?
Fisherprobe Laspeyres Paasche FisherIdentitatsprobe + + +Zeitumkehrprobe − − +Rundprobe − − −Faktorumkehrprobe − − +Proportionalitatsprobe + + +Dimensionswechselprobe + + +Bestimmtheitsprobe + + +
Fazit:
• Der Fisher-Index erfullt die meisten, aber auch nicht alle Kri-terien (6 von 7)
198
6. Auswertung mehrdimensionaler Daten
Bisher:
• Auswertungsmethoden fur Daten eines einzelnen Merkmals,z.B.
Diskrete Klassierung
Grafische Darstellungen (Verteilungsfunktion)
Lagemaße
Streungsmaße
Schiefemaße
199
Jetzt:
• Methoden zur Auswertung von Daten uber mehrere Merk-male gleichzeitig(mehrdimensionale oder multivariate Daten)
Ziele:
• Simultane Beschreibung durch Tabellen und Grafiken
• Mehrdimensionale Messung von Lage und Streuung
• Aufdecken von Beziehungen zwischen den Merkmalen(Korrelationen)
200
6.1 Grundbegriffe
Ausgangssituation: [I]
• n Merkmalstrager e1, e2, . . . , en
• Grundgesamtheit: G = {e1, e2, . . . , en}
• 2 Merkmale X und Y , die jeweils am Merkmalstrager ei, i =1, . . . , n, beobachtet werden konnen
201
Ausgangssituation: [II]
• Urliste lautet dann:
(x1, y1), (x2, y2), . . . , (xn, yn)
oder in Matrix-Schreibweise
x1 y1x2 y2... ...
xn yn
(n× 2 Matrix)
202
Beispiel: [I]
• Ausgaben fur Werbung und Absatze von 84 Unternehmen inden USA im Jahr 1990
• Merkmale
X: Ausgaben fur Werbung (in Mill. US-$)
Y : Absatz (in Mill. US-$)
203
Beispiel: [II]
• Datensatz:
i Werbeausgaben (X) Absatze (Y)1 11.22487 508.83022 31.08904 517.04253 70.32822 524.7197... ... ...
82 31.50510 502.037883 55.39850 515.297684 48.43819 501.1283
• Falls X und Y metrisch skaliert sind (wie hier), kann man dien Datenpunkte (x1, y1), . . . , (xn, yn) in einem Streudiagrammdarstellen
204
Streudiagramm ’Werbeausgaben gegen Absatzzahlen’
205
480
500
520
540
560
0 20 40 60 80 100
Werbeausgaben in Mill. US-$ (X)
Abs
atz
in M
ill.
US-
$ (Y
)
Jetzt:
• Betrachte p ≥ 2 Merkmale X1, . . . , Xp mit Beobachtungen(xi1, xi2, . . . , xip) fur die Untersuchungseinheit ei−→ Urliste bzw. n× p Datenmatrix:
(x11, x12, . . . , x1p), (x21, x22, . . . , x2p), . . . , (xn1, xn2, . . . , xnp)
x11 x12 . . . x1px21 x22 . . . x2p... ... . . . ...
xn1 xn2 . . . xnp
206
6.1.1 Kontingenztafel und Haufigkeiten
Gegeben:
• 2 Merkmale X und Y
• n× 2 Datenmatrix
x1 y1x2 y2... ...
xn yn
bzw. Urliste mit n Zahlenpaaren
(xi, yi), i = 1, . . . , n,
207
Ziel:
• Beschreibung von absoluten und relativen Haufigkeiten
Notation:
• ξ1, . . . , ξJ seien die J moglichen Werte von X
• η1, . . . , ηK seien die K moglichen Werte von Y
208
Definition 6.1: (Gemeinsame und Randhaufigkeiten) [I]
Fur jedes j = 1, . . . , J und k = 1, . . . , K versteht man
1. unter der gemeinsamen absoluten Haufigkeit die Anzahl njkaller Datenpaare (xi, yi) fur die gilt xi = ξj und yi = ηk.
2. unter den absoluten Randhaufigkeiten der X-Auspragung ξjbzw. der Y -Auspragung ηk die Summen
nj· =K∑
k=1njk bzw. n·k =
J∑
j=1njk.
209
Definition 6.1: (Gemeinsame und Randhaufigkeiten) [II]
3. Die gemeinsamen absoluten Haufigkeiten zusammen mit denabsoluten Randhaufigkeiten stellt man ubersichtlich in derfolgenden Haufigkeitstabelle dar, die man Kontingenztafeloder Kontingenztabelle nennt:
Y =η1 η2 . . . ηK−1 ηK∑
ξ1 n11 n12 . . . n1(K−1) n1K n1·ξ2 n21 n22 . . . n2(K−1) n2K n2·
X = ... ... ... ... ... ...ξJ−1 n(J−1)1 n(J−1)2 . . . n(J−1)(K−1) n(J−1)K n(J−1)·
ξJ nJ1 nJ2 . . . nJ(K−1) nJK nJ ·∑
n·1 n·2 . . . n·(K−1) n·K n
210
Beispiel: [I]
• Erhebung folgender Merkmale bei n = 1000 Personen:
Berufszugehorigkeit X
Ausmaß sportlicher Betatigung Y
211
Beispiel: [II]
• Kontingenztabelle:
Y (sportliche Betatigung)X (Berufsgruppe) nie gelegentlich regelmaßig
∑
Arbeiter 240 120 70 430Angestellte 160 90 90 340Beamte 30 30 30 90Landwirte 37 7 6 50sonstige 40 32 18 90∑
507 279 214 1000
• Offensichtlich:Aus gemeinsamen Haufigkeiten lassen sich Randhaufigkeiteneindeutig bestimmen(Umkehrung gilt nicht!)
212
Definition 6.2: (Relative Haufigkeiten, Randverteilung)
Fur jedes j = 1, . . . , J und k = 1, . . . , K heißen
1. fjk =njkn die gemeinsame relative Haufigkeit von ξj und ηk,
2. fj· =∑K
k=1 fjk bzw. f·k =∑J
j=1 fjk die relative Randhaufigkeitvon ξj bzw. ηk.
3. Die relativen Randhaufigkeiten f1·, f2·, . . . , fJ · der Werte vonX nennt man die Randverteilung des Merkmals X. Entspre-chend bilden die relativen Randhaufigkeiten f·1, f·2, . . . , f·K dieRandverteilung des Merkmals Y .
213
Kontingenztafel mit relativen Haufigkeiten:
Y =η1 η2 . . . ηK−1 ηK∑
ξ1 f11 f12 . . . f1(K−1) f1K f1·ξ2 f21 f22 . . . f2(K−1) f2K f2·
X = ... ... ... ... ... ...ξJ−1 f(J−1)1 f(J−1)2 . . . f(J−1)(K−1) f(J−1)K f(J−1)·
ξJ fJ1 fJ2 . . . fJ(K−1) fJK fJ ·∑
f·1 f·2 . . . f·(K−1) f·K 1
214
Bemerkung:
• Offensichtlich gilt:
J∑
j=1
K∑
k=1fjk =
J∑
j=1fj· =
K∑
k=1f·k = 1
(Die Summe uber den relativen Randhaufigkeiten eines jedenMerkmals ist 1)
215
Kontingenztabelle mit relativen Haufigkeiten fur das obige Beispiel:
Y (sportliche Betatigung)X (Berufsgruppe) nie gelegentlich regelmaßig
∑
Arbeiter 0.240 0.120 0.070 0.430Angestellte 0.160 0.090 0.090 0.340Beamte 0.030 0.030 0.030 0.090Landwirte 0.037 0.007 0.006 0.050sonstige 0.040 0.032 0.018 0.090∑
0.507 0.279 0.214 1.000
216
6.1.2 Bedingte Verteilungen
Jetzt:
• Weiteres wichtiges Konzept der mehrdimensionalen Daten-analyse
Definition 6.3: (Bedingte relative Haufigkeiten)
Fur ein festes k ∈ {1, . . . , K} sowie fur jedes j = 1, . . . , J nenntman die Große
fj|Y =ηk=
fjk
f·kdie bedingte relative Haufigkeit von ξj unter der Bedingung Y =ηk.
217
Bemerkung:
• Die bedingte relative Haufigkeit fj|Y =ηkist die relative Haufigkeit
der X-Auspragung ξj in der Teilgesamtheit aller derjenigenEinheiten, welche die Y -Auspragung ηk aufweisen, denn
fj|Y =ηk=
fjk
f·k=
njk
nn·kn
=njk
n·k
Definition 6.4: (Bedingte Verteilung)
Gemaß Definition 6.3 kann man insgesamt J bedingte relativeHaufigkeiten betrachten:
f1|Y =ηk, f2|Y =ηk
, . . . , fJ |Y =ηk.
Die Gesamtheit dieser J Werte heißt die bedingte Verteilung vonX unter (der Bedingung) Y = ηk.
218
Bemerkungen: [I]
• Analog zu Definition 6.3 definiere fur ein festes j ∈ {1, . . . , J}sowie fur beliebige k = 1, . . . , K
fk|X=ξj=
fjk
fj·.
Diese Große heißt bedingte relative Haufigkeit von ηk unter(der Bedingung) X = ξj.
• Analog zu Definition 6.4 heißt
f1|X=ξj, f2|X=ξj
, . . . , fK|X=ξj
die bedingte Verteilung von Y unter X = ξj
219
Bemerkungen: [II]
• Offensichtlich gilt:
J∑
j=1fj|Y =ηk
=J
∑
j=1
njk
n·k= 1 fur jedes k = 1, . . . , K
K∑
k=1fk|X=ξj
=K∑
k=1
njk
nj·= 1 fur jedes j = 1, . . . , J
220
Beispiel: (Berufsgruppe ←→ Sport, vgl. Folien 211 ff.)
Gesucht: [I]
• Verteilung der sportlichen Aktivitat bei Arbeiternoder statistisch ausgedruckt:Die bedingte Verteilung von Y unter X = ξ1
f1|X=ξ1 =n11
n1·=
240430
= 0.558 (nie)
f2|X=ξ1 =n12
n1·=
120430
= 0.279 (gelegentlich)
f3|X=ξ1 =n13
n1·=
70430
= 0.163 (regelmaßig)
221
Gesucht: [II]
• Verteilung der Berufsgruppen bei regelmaßig Aktivenoder statistisch ausgedruckt:Die bedingte Verteilung von X unter Y = η3
f1|Y =η3=
70214
= 0.327 (Arbeiter)
f2|Y =η3=
90214
= 0.421 (Angestellte)
f3|Y =η3=
30214
= 0.140 (Beamte)
f4|Y =η3=
6214
= 0.028 (Landwirte)
f5|Y =η3=
18214
= 0.084 (sonstige)
222
6.1.3 Deskriptive Unabhangigkeit
Jetzt:
• Frage nach dem Zusammenhang zwischen X und Y
Definition 6.5: (Deskriptive Unabhangigkeit)
Die Merkmale X und Y heißen deskriptiv unabhangig, falls sichfur alle j = 1, . . . , J und fur alle k = 1, . . . , K die gemeinsamenrelativen Haufigkeiten als Produkt der relativen Randhaufigkeitenergeben, d.h. falls gilt
fjk = fj· · f·k.
223
Beispiel: (Geschlecht (X) ←→ gewahlte Partei (Y ))
Kontingenztafel mit absoluten Haufigkeiten:
Y (Partei)X (Geschlecht) A B C
∑
mannlich 200 120 80 400weiblich 300 180 120 600
∑
500 300 200 1000
224
Kontingenztafel mit relativen Haufigkeiten:
Y (Partei)X (Geschlecht) A B C
∑
mannlich 0.20 0.12 0.08 0.40weiblich 0.30 0.18 0.12 0.60
∑
0.50 0.30 0.20 1.00
f11 = 0.20 = 0.40 · 0.50 = f1· · f·1f12 = 0.12 = 0.40 · 0.30 = f1· · f·2f13 = 0.08 = 0.40 · 0.20 = f1· · f·3f21 = 0.30 = 0.60 · 0.50 = f2· · f·1f22 = 0.18 = 0.60 · 0.30 = f2· · f·2f23 = 0.12 = 0.60 · 0.20 = f2· · f·3
Fazit: X und Y sind deskriptiv unabhangig225
Betrachte nun:
• Bedingte Verteilungen von X unter Y = η1, Y = η2, Y = η3
• Bedingte Verteilungen von Y unter X = ξ1, X = ξ2
Bedingte Verteilungen von X: [I]
• unter Y = η1:
f1|Y =η1=
f11
f·1=
0.200.50
= 0.40
f2|Y =η1=
f21
f·1=
0.300.50
= 0.60
226
Bedingte Verteilungen von X: [II]
• unter Y = η2:
f1|Y =η2=
f12
f·2=
0.120.30
= 0.40
f2|Y =η2=
f22
f·2=
0.180.30
= 0.60
• unter Y = η3:
f1|Y =η3=
f13
f·3=
0.080.20
= 0.40
f2|Y =η3=
f23
f·3=
0.120.20
= 0.60
227
Offensichtlich:
• Bedingte Verteilungen von X unter Y = η1, Y = η2, Y = η3sind alle gleich
• Man uberpruft leicht, dass die bedingten Verteilungen von Yunter X = ξ1, X = ξ2 ebenfalls beide gleich sind
228
Allgemein gilt:X und Y sind genau dann deskriptiv unabhangig, sobald eine derfolgenden aquivalenten Bedingungen erfullt ist:
• Fur alle j = 1, . . . , J und alle k = 1, . . . , K gilt:
fjk = fj· · f·k (= Definition 6.5)
• Fur alle j = 1, . . . , J und alle k = 1, . . . , K gilt:
njk =nj· · n·k
n
• Fur alle j = 1, . . . , J gilt:
fj|Y =η1= fj|Y =η2
= . . . = fj|Y =ηK= fj·
• Fur alle k = 1, . . . , K gilt:
fk|X=ξ1 = fk|X=ξ2 = . . . = fk|X=ξJ= f·k
229
6.1.4 Arithmetische Mittel und Varianzen
Annahmen:
• X und Y sind metrisch skaliert(sinnvolle Arithmetik)
• Daten liegen in Kontingenztafeln vor(absolute oder relative Haufigkeiten)
230
Jetzt:
• Ubertragung von Mittelwert und Varianz auf mehrdimension-ale Daten
−→ Mittelwert- und Varianzbildung uber Rand- bzw. bedingteVerteilungen
Definition 6.6: (Arithmetische Mittel)
Die arithmetischen Mittel von X und Y sind definiert als diearithmetischen Mittel der jeweiligen Randverteilung:
x =1n
J∑
j=1ξj · nj· =
J∑
j=1ξj · fj·,
y =1n
K∑
k=1ηk · n·k =
K∑
k=1ηk · f·k.
231
Bemerkung:
• In mehrdimensionalen Datensatzen sind die arithmetischenMittel einzelner Merkmale einfach die Mittelwerte der einzel-nen Datenreihen
Definition 6.7: (Bedingte arithmetische Mittel)
Das bedingte arithmetische Mittel von X unter Y = ηk (k fest)sowie das bedingte arithmetische Mittel von Y unter X = ξj(j fest) sind jeweils definiert als die arithmetischen Mittel derentsprechenden bedingten Verteilungen von X und Y :
xk =1
n·k
J∑
j=1ξj · njk =
J∑
j=1ξj · fj|Y =ηk
,
yj =1
nj·
K∑
k=1ηk · njk =
K∑
k=1ηk · fk|X=ξj
.
232
Bemerkungen:
• Sind X und Y deskriptiv unabhangig, so stimmen samtlichebedingte Verteilungen von X mit der Randverteilung von Xuberein (vgl. Folie 229). Da das bedingte arithmetische Mit-tel von X unter Y = ηk der Mittelwert der entsprechendenbedingten Verteilung von X ist, stimmt im Fall der deskrip-tiven Unabhangigkeit fur jedes k der bedingte Mittelwert xkmit dem gewohnlichen Mittelwert uberein:
x1 = x2 = . . . = xK = x
• Analog gilt im Fall der deskriptiven Unabhangigkeit fur diebedingten Mittelwerte von Y :
y1 = y2 = . . . = yJ = y
233
Jetzt:
• Definition von Varianzen und bedingten Varianzen von X undY
Definition 6.8: (Varianz)
Die Varianzen von X und Y sind definiert als die Varianzen derjeweiligen Randverteilungen, d.h.
s2X =1n
J∑
j=1
(
ξj − x)2· nj· =
1n
J∑
j=1ξ2j · nj· − x2,
s2Y =1n
K∑
k=1(ηk − y)2 · n·k =
1n
K∑
k=1η2k · n·k − y2.
234
Bemerkung:
• In mehrdimensionalen Datensatzen sind die Varianzen dereinzelnen Merkmale einfach die Varianzen der einzelnen Daten-reihen
Definition 6.9: (Bedingte Varianz)
Die bedingte Varianz von X unter Y = ηk (k fest) sowie diebedingte Varianz von Y unter X = ξj (j fest) sind definiert alsdie Varianzen der entsprechenden bedingten Verteilungen von Xund Y :
s2X|Y =ηk=
J∑
j=1
(
ξj − xk)2·njk
n·k=
J∑
j=1ξ2j ·
njk
n·k− x2
k,
s2Y |X=ξj=
K∑
k=1
(
ηk − yj)2·njk
nj·=
K∑
k=1η2k ·
njk
nj·− y2
j .
235
Bemerkungen:
• Sind X und Y deskriptiv unabhangig, so stimmen samtlichebedingte Verteilungen von X mit der Randverteilung von Xuberein (vgl. Folie 229). Da die bedingte Varianz von X unterY = ηk die Varianz der entsprechenden bedingten Verteilungvon X ist, stimmt im Fall der deskriptiven Unabhangigkeit furjedes k die bedingte Varianz s2X|Y =ηk
mit der gewohnlichenVarianz uberein:
s2X|Y =η1= s2X|Y =η2
= . . . = s2X|Y =ηK= s2X
• Analog gilt im Fall der deskriptiven Unabhangigkeit fur diebedingten Varianzen von Y :
s2Y |X=ξ1= s2Y |X=ξ2
= . . . = s2Y |X=ξJ= s2Y
236
Beispiel: (Wohnraum)
• Betrachte n = 1000 Wohnungen
• Merkmale:
X: Anzahl der Wohnraume pro Wohnung
Y : Anzahl der Personen pro Wohnung
237
Y = 1 Y = 2 Y = 3 Y = 4 Y = 5∑
X = 1 200 40 0 0 0 240X = 2 200 100 30 10 0 340X = 3 80 40 100 60 10 290X = 4 20 15 10 20 20 85X = 5 0 5 10 10 20 45
∑
500 200 150 100 50 1000
Berechnung von (bedingten) Mittelwerten und Varianzen
• Im Proseminar
238
6.2 Zusammenhangsmaße
Gegeben:
• Zwei Merkmale X und Y mit Urliste der Lange n
Gesucht:
• Maßzahl fur den Zusammenhang zwischen X und Y
239
Beispiele:
• Zusammenhang zwischen Korpergroße (X) und Korperge-wicht (Y )
• Zusammenhang zwischen Inflationsrate (X) und Arbeitslo-senquote (Y )(Phillips-Kurve)
• Zusammenhang zwischen Arbeitslosigkeit (X) und Wirt-schaftswachstum (Y )(Okunsches Gesetz)
240
Wichtiges Charakteristikum:
• Datenniveau von X und Y
Metrische Skalierung
Ordinale Skalierung
Nominale Skalierung
241
6.2.1 Metrische Daten: Korrelationskoeffizient
Situation:
• X und Y sind metrisch skaliert
• Urliste: (x1, y1), . . . , (xn, yn)
Frage:
• Wie hangen X und Y zusammen?
242
Zunachst:
• Betrachte fur ein festes i ∈ {1, . . . , n} die Große
T1 = (xi − x) · (yi − y)
Offensichtlich gilt:
• T1 > 0
=⇒ xi und yi sind beide jeweils großer oder beide jeweils kleinerals ihre Mittelwerte
• T1 < 0
=⇒ xi und yi verhalten sich jeweils umgekehrt bzgl. ihrer Lagezum jeweiligen Mittelwert
243
Jetzt:
• Summenbildung uber alle Daten
T2 =n
∑
i=1(xi − x) · (yi − y)
• T2 � 0:
=⇒ Die positiven Summanden in T2 uberwiegen die negativenerheblich. Zu ’hohen’ bzw. ’niedrigen’ xi gehoren tenden-ziell ’hohe’ bzw. ’niedrige’ yi(positiver Zusammenhang)
244
Summenbildung uber alle Daten: [II]
• T2 � 0:
=⇒ Die negativen Summanden in T2 uberwiegen die positivenerheblich. Zu ’hohen’ bzw. ’niedrigen’ xi gehoren tenden-ziell nun ’niedrige’ bzw. ’hohe’ yi(negativer Zusammenhang)
• T2 ≈ 0:
=⇒ Positive und negative Summanden in T2 heben sich ten-denziell auf. Zu ’hohen’ (’niedrigen’) xi gehoren nunsowohl ’niedrige’ als auch ’hohe’ yi(kein Zusammenhang)
245
Definition 6.10: (Kovarianz)
Die Kovarianz zwischen X und Y ist definiert durch
sXY =1n
n∑
i=1(xi − x) · (yi − y) =
1n
n∑
i=1xi · yi − x · y.
Bemerkungen: [I]
• Die Kovarianz sXY ist ’symmetrisch’, d.h.
sXY = sY X
246
Bemerkungen: [II]
• Die Kovarianz eines Merkmals mit sich selbst ist gleich derVarianz des Merkmals:
sXX =1n
n∑
i=1(xi − x)2 = s2X
• Liegt die Datenurliste in Form einer Haufigkeitstabelle vor,so ist die Kovarianz gegeben durch
sXY =1n
J∑
j=1
K∑
k=1
(
ξj − x)
· (ηk − y) · njk
=1n
J∑
j=1
K∑
k=1ξj · ηk · njk − x · y
247
Jetzt:
• Normierung der Kovarianz sXY durch Division durch das Pro-dukt der Standardabweichungen von X und Y
248
Definition 6.11: (Korrelationskoeffizient von Bravais-Pearson)
Der Korrelationskoeffizient zwischen X und Y ist definiert durch
rXY =sXY
√
s2X ·√
s2Y=
n∑
i=1(xi − x) · (yi − y)
√
√
√
√
n∑
i=1(xi − x)2 ·
√
√
√
√
n∑
i=1(yi − y)2
=
n∑
i=1xi · yi − n · x · y
√
√
√
√
n∑
i=1x2
i − n · x2 ·
√
√
√
√
n∑
i=1y2i − n · y2
.
249
Bemerkungen: [I]
• Der Korrelationskoeffizient rXY ist ’symmetrisch’:
rXY = rY X
• Der Korrelationskoeffizient ist normiert, d.h. es gilt immer
−1 ≤ rXY ≤ 1
• Wenn rXY = 0 ist, so sagt man:
’Die Merkmale X und Y sind unkorreliert’
250
Bemerkungen: [II]
• Sind X und Y deskriptiv unabhangig, so gilt: rXY = 0(Deskrip. Unabhangigkeit impliziert Unkorreliertheit)
• Vorsicht:Die Umkehrung gilt im allgemeinen nicht(Unkorreliertheit (rXY = 0) impliziert nicht die deskriptiveUnabhangigkeit von X und Y )
• Ist rXY = 1 oder rXY = −1, so sagt man:
’Die Merkmale X und Y sind perfekt korreliert’
251
Zentrales Resultat:
• Es gilt rXY = 1 genau dann, wenn es Zahlen a > 0, b ∈ Rgibt, so dass yi = a · xi + b fur alle i = 1, . . . , n gilt
(Alle Daten liegen auf einer Geraden mit positiver Steigung)
• Es gilt rXY = −1 genau dann, wenn es Zahlen a < 0, b ∈ Rgibt, so dass yi = a · xi + b fur alle i = 1, . . . , n gilt
(Alle Daten liegen auf einer Geraden mit negativer Steigung)
252
Offensichtlich:
• Der Korrelationskoefizient rXY ist ein Maß fur den linearenZusammenhang zwischen X und Y
Vorsicht:
• rXY = 0 (bzw. rXY ≈ 0) bedeutet nur, dass kein (bzw. nurein schwacher) linearer Zusammenhang zwischen X und Ybesteht. Es konnen aber trotzdem starke andere (nicht-lineare) Zusammenhange zwischen X und Y bestehen
253
-4
-2
0
2
4
6
-4 -2 0 2 4
X
Y
Korrelation zwischen X und Y: -0.008
-6
-4
-2
0
2
4
6
-4 -2 0 2 4
X
Y1
Korrelation zwischen X und Y1: 0.7020
-6
-4
-2
0
2
4
6
-4 -2 0 2 4
X
Y2
Korrelation zwischen X und Y 2: -0.7054
0
5
10
15
20
-4 -2 0 2 4
X
Y3
Korrelation zwischen X und Y3: 0.0225
Weitere Aspekte zur Korrelation: [I]
• Korrelation und Kausalitat
• Scheinkorrelation:Die zu untersuchenden Merkmale X und Y hangen beidevon einem 3. Merkmal Z ab, das nicht Gegenstand der Un-tersuchung ist. Ein hoher Wert fur rXY kann daher zus-tandekommen, weil sowohl X als auch Y von Z abhangen(indirekter Zusammenhang)
Beispiel:
X: Wortschatz eines KindesY : Korpergroße eines KindesZ: Alter eines Kindes
255
Weitere Aspekte zur Korrelation: [II]
• Nonsens-Korrelation:Hohe Korrelation zwischen vollig sachfremden Merkmalen Xund Y
Beispiel:
Hohe Korrelation zwischen (menschlicher) Geburtenrate(X) einer Region und deren Population von Klapperstor-chen (Y )
256
6.2.2 Ordinale Daten: Rangkorrelationskoeffizient
Jetzt:
• X und Y sind ordinal skaliert
=⇒ Berechnung vonarithmetischem MittelVarianz und Kovarianz
nicht sinnvoll
Gesucht:
• Sinnvolles Korrelationsmaß fur ordinale Daten
257
Zunachst Zusatzannahme:
• Alle Daten eines Merkmals sind verschieden, d.h.
xi 6= xj und yi 6= yj fur alle i 6= j
Damit:
• Einfache Definition der Rangzahl einer Merkmalsauspragungxi bzw. yi
258
Definition 6.12: (Rangzahl eines Datenpunktes)
Gegeben seien die ungeordnete Urliste x1, . . . , xn sowie die geord-nete Urliste x(1) < x(2) < . . . < x(n) eines Merkmals X. Unter derRangzahl (kurz: Rang) eines Datenwertes xi, in Zeichen RX(xi),versteht man die Position, die xi in der geordneten Urliste ein-nimmt, d.h.
RX(xi) = r, falls xi = x(r).
259
Zahlenbeispiel:
• Ungeordnete Urliste
x1 x2 x3 x4 x5 x61 4 7 3 6 8
• Geordnete Urliste
x(1) x(2) x(3) x(4) x(5) x(6)(= x1) (= x4) (= x2) (= x5) (= x3) (= x6)
1 3 4 6 7 8
• Damit ergeben sich folgende Rangzahlen:
RX(x1) = 1, RX(x2) = 3, RX(x3) = 5,
RX(x4) = 2, RX(x5) = 4, RX(x6) = 6
260
Sinnvolles Korrelationsmaß fur ordinale Daten:
• Korrelationskoeffizient aus Definition 6.11 angewendet aufdie Range RX(xi) und RY (yi)
Definition 6.13: (Rangkorrelationskoeff. von Spearman)
Es bezeichnen RX und RY die arithmetischen Mittel der Rangzahlender Merkmale X und Y . Der Rangkorrelationskoeffizient zwis-chen X und Y ist definiert durch
rRXY =
n∑
i=1
(
RX(xi)−RX)
·(
RY (yi)−RY)
√
√
√
√
n∑
i=1
(
RX(xi)−RX)2·
√
√
√
√
n∑
i=1
(
RY (yi)−RY)2
.
261
Man beachte:
• Fur die arithmetischen Mittel RX und RY gilt:
RX = RY =1n
n∑
i=1i =
1n·n · (n + 1)
2=
n + 12
(vgl. Folie 27)
Hieraus folgt:
rRXY =
n∑
i=1
(
RX(xi)−n + 1
2
)
·(
RY (yi)−n + 1
2
)
√
√
√
√
n∑
i=1
(
RX(xi)−n + 1
2
)2·
√
√
√
√
n∑
i=1
(
RY (yi)−n + 1
2
)2
262
Bemerkungen:
• Es gibt weitere, aquivalente Formeln fur rRXY , z.B.
rRXY =
n∑
i=1RX(xi) ·RY (yi)−
n · (n + 1)2
4√
√
√
√
n∑
i=1RX(xi)
2 −n · (n + 1)2
4·
√
√
√
√
n∑
i=1RY (yi)
2 −n · (n + 1)2
4
• Sind alle xi und yi verschieden (wie hier zunachst angenom-men), so ergibt sich die vereinfachte Formel
rR,OBXY = 1−
6n
∑
i=1[RX(xi)−RY (yi)]
2
n · (n2 − 1)
263
Beispiel: (Schulnoten)
• 6 Schuler haben folgende Punktzahlen auf einer von 1 bis 10reichenden Ordinalskala fur Klausuren in Mathematik (X)und Physik (Y ) erreicht:
x1 x2 x3 x4 x5 x6 y1 y2 y3 y4 y5 y61 4 7 3 6 8 1 2 9 4 10 5
Es gilt:
rRXY = rR,OB
XY = 1−6 · 10
6 · (62 − 1)= 0.714
264
Wichtige Eigenschaften von rRXY : [I]
• rRXY ist symmetrisch, d.h. rR
XY = rRY X
• rRXY ist invariant gegenuber streng monoton wachsenden
Transformationen:
Sind f und g streng monoton wachsende Funktionen unduberfuhrt man die Ursprungsdaten (xi, yi) in
x′i = f(xi) und y′i = g(yi) fur alle i = 1, . . . , n
so gilt fur alle i:
RX ′(x′i) = RX(xi) RY ′(y′i) = RY (yi)
und damit
rRXY = rR
X ′Y ′
265
Wichtige Eigenschaften von rRXY : [II]
• rRXY ist normiert:
−1 ≤ rRXY ≤ 1
• Extremfalle:
rRXY = 1 ⇐⇒ RX(xi) = RY (yi) fur alle i = 1, . . . , n
(vollig gleich gerichteter monoton wachsender Zusammen-hang)
rRXY = −1 ⇐⇒ RX(xi) = n−RY (yi)+1 fur alle i = 1, . . . , n
(vollig gegenlaufiger monoton fallender Zusammenhang)
266
Jetzt:
• Berucksichtigung von Bindungen durch Anwendung der Meth-ode der Durchschnittsrange
Zahlenbeispiel: [I]
• Ungeordnete Urliste
x1 x2 x3 x43.7 3.9 3.1 3.7
267
Zahlenbeispiel: [II]
• Geordnete Urliste
x(1) x(2) x(3) x(4)(= x3) (= x1) (= x4) (= x2)3.1 3.7 3.7 3.9
• Vergabe von Rangen
RX(x3) = 1, RX(x1) = 2, RX(x4) = 3︸ ︷︷ ︸
(wegen x1 = x4 = 3.7)RX(x1) = 2.5, RX(x4) = 2.5
, RX(x2) = 4
268
Bei Auftreten von Bindungen:
• Vergabe von Durchschnittsrangen sowohl fur die xi als auchdie yi
• Die vereinfachte Formel rR,OBXY (vgl. Folie 263) nicht mehr
zulassig
Stattdessen:
Anwendung der aquivalenten Formeln fur rRXY auf den
Folien 262, 263
269
6.2.3 Nominale Daten: Kontingenzkoeffizient
Jetzt:
• X und Y sind nominal skaliert
• Daten in Kontingenztafel (absolute Haufigkeiten)
Geeignetes Zusammenhangsmaß:
• Der Kontingenzkoeffizient
270
Voruberlegung:
• X und Y sind deskriptiv unabhangig, wenn
njk =nj· · n·k
nfur alle j = 1, . . . , J und k = 1, . . . , K(vgl. Folie 229)
Abweichungsmaß von der deskriptiven Unabhangigkeit:
χ2 =J
∑
j=1
K∑
k=1
(
njk −nj· · n·k
n
)2
nj· · n·kn
= n ·
J∑
j=1
K∑
k=1
n2jk
nj· · n·k− 1
271
Bemerkung:
• Damit χ2 definiert ist, muss gelten: nj· > 0 und n·k > 0 furalle j und alle k. Ist einer der beiden Ausdrucke fur irgendeinj oder k gleich 0, so konnen die zugehorigen Merkmalswerteξj bzw. ηk aus der Kontingenztafel gestrichen werden
Jetzt:
• Normierung von χ2 liefert Kontingenzkoeffizient
272
Definition 6.14: (Kontingenzkoeffizient)
Als Zusammenhangsmaß zwischen den nominal skalierten Merk-malen X und Y verwendet man den Kontingenzkoeffizienten, derdefiniert ist als
CXY =
√
√
√
√
χ2
χ2 + n·
min{J, K}min{J, K} − 1
.
Bemerkung:
• Der Kontingenzkoeffizient CXY ist streng monoton wachsendin χ2 und normiert, d.h.
0 ≤ CXY ≤ 1
273
Zentrales Ergebnis:
• Der Kontingenzkoeffizient CXY wird genau dann gleich 0,wenn χ2 = 0 gilt, d.h. genau dann, wenn X und Y deskriptivunabhangig sind
Weitere Bemerkungen:
• Gilt CXY = 1, so spricht man von einem vollstandigen Zusam-menhang zwischen X und Y
• CXY misst nur die Starke des Zusammenhangs zwischen Xund Y , nicht jedoch die Richtung
• Jedoch misst CXY beliebige Zusammenhange, also nicht nurlineare (wie rXY ) oder monotone wie rR
XY
274
Zur praktischen Anwendung von rXY , rRXY , CXY :
• Unterschiedliche Datenniveaus von X und Y :
Wahle Zusammenhangsmaß fur das ’schwachste’ Daten-niveau der Variablen X und Y(vgl. Folie 276)
• Ermittlung des allgemeinen Zusammenhangs von X und Y :
Verwende CXY
275
Behandlung unterschiedlicher Datenniveaus:
Y Nominal Ordinal MetrischXNominal CXY CXY CXY
Ordinal CXY rRXY rR
XY
Metrisch CXY rRXY rXY
276
6.3 Deskriptive Regression
Bedeutung des Begriffes ’Regression’:
• Untersuchung des Zusammenhangs zwischen einer abhangi-gen Variablen (auch Regressand oder endogene Variable) undeiner oder mehrerer unabhangiger Variablen (auch Regres-soren oder exogene Variablen)
Allgemeines mathematisches Modell:
Y = f(X1, X2, . . . , Xk; ~β) + u
277
Bezeichnungen:
• Y : abhangige Variable, Regressand
• X: unabhangige Variablen, Regressoren
• f(·): funktionaler Zusammenhang
• ~β: unbekannter Parametervektor
• u: Fehler
278
Ziel der Regressionsrechnung:
• Moglichst ’genaue’ Aussagen uber den Zusammenhang zwis-chen Regressand und Regressor(en)
Beispiele: [I]
• Keynesianische Konsumfunktion
Y = a + b ·X + u
Y = privater Konsuma = autonomer Konsumb = marginale KonsumquoteX = verfugbares Einkommen
279
Beispiele: [II]
• Zusammenhang zwischen Inflation und Geldmengenwachs-tum (Quantitatstheorie)
Y = a + b ·X + u
Y = InflationsrateX = Wachstumsrate der Geldmenge (M2)
• Zusammenhang zwischen Inflation und Arbeitslosigkeit (Phillip-skurve)
Y = a + b ·1X
+ u
Y = InflationsrateX = Arbeitslosenquote(Vorsicht: f ist eine Hyperbel, nicht-linear)
280
6.3.1 Regression 1. Art
Zunachst:
Y wird zuruckgefuhrt (regressiert) auf verschiedene Auspra-gungen von X(ohne funktionalen Zusammenhang)
Voraussetzungen:
• Y ist metrisch skaliert(mindestens intervallskaliert)
• X ist beliebig skaliert mit moglichen Auspragungen ξ1, . . . , ξJ
282
Jetzt:
• Bilde die bedingten Mittelwerte yj unter der Bedingung X =ξj fur j = 1, . . . , J(vgl. Definition 6.7, Folie 232)
Definition 6.15: (Deskriptive Regression 1. Art)
Die J Paare (ξj, yj), j = 1, . . . , J, nennt man deskriptive Regres-sion 1. Art von Y auf X.
283
Beispiel: (Haushaltseinkommen) [I]
• Y : verfugbares Haushalts-Nettoeinkommen(Durchschnitte)
• X: Haushaltstyp
284
Beispiel: (Haushaltseinkommen) [II]
• Daten:
Einkommen Y Anz. Haushaltej Haushaltstyp X (in DM) (in (1000)1 Selbstandige 8470 22482 Beamte 7977 17343 Angestellte 6150 104524 Arbeiter 4967 72405 Arbeitslose 2892 19836 Nichterwerbstatige 3756 13124
Summe: 36781
285
Hier:
• Regressionsergebnis dargestellt als Balkendiagramm
286
0100020003000400050006000700080009000
j=1 j=2 j=3 j=4 j=5 j=6
Offensichtlich:
• Durch die J Auspragungen von X kann die Grundgesamtheitin J Teilgesamtheiten zerlegt werden
• Die J Teilgesamtheiten haben die Umfange n1·, n2·, . . . , nJ ·
=⇒ Anwendung der Additionssatze fur arithmetische Mittelund Varianzen des Merkmals Y(vgl. Abschnitt 4.3.4)
287
Es gilt:
y =1n
J∑
j=1yj · nj·
s2Y =1n
J∑
j=1s2Y |X=ξj
· nj·
︸ ︷︷ ︸
=s2int
+1n
J∑
j=1
(
yj − y)2· nj·
︸ ︷︷ ︸
=s2ext
Hieraus:
• Maßzahl fur den Erklarungswert der unabhangigen VariablenX fur die abhangige Variable Y
288
Definition 6.16: (Bestimmtheitsmaß)
Die Große
B =s2exts2Y
heißt Bestimmtheitsmaß der deskriptiven Regression 1. Art.
Bemerkungen: [I]
• Es gilt stets:
0 ≤ B ≤ 1
289
Bemerkungen: [II]
• Es gilt B = 0 genau dann, wenn s2ext = 0 , d.h. wenn
y1 = y2 = . . . = yJ = y
=⇒ Alle bedingten Mittel yj sind gleich
=⇒ X hat keinen Erklarungswert fur Y
• Es gilt B = 1 genau dann, wenn s2Y = s2ext und s2int = 0
=⇒ Fur alle bedingten Varianzen gilt sY |X=ξj= 0
=⇒ X hat hochsten Erklarungswert fur Y
290
Bemerkungen: [III]
• B gibt den Anteil der durch die Regression 1. Art erklartenVarianz an der Gesamtvarianz von Y an
291
6.3.2 Regression 2. Art: Die lineare Einfachregre-ssion
Jetzt:
• X und Y sind beide metrisch skaliert
Ziel:
• Erklarung der Abhangigkeit zwischen X und Y durch eineGerade
292
Ausgangssituation:
• Urliste (x1, y1), . . . , (xn, yn)
• Regressionsgleichung
yi = a + b · xi + ui (i = 1, . . . , n)
• a, b sind aus den Daten zu bestimmende Parameter
• ui ist die Abweichung (auch Fehler oder Residuum)
293
Problemstellung:
• Bestimme die Parameter a und b aus den Daten derart, dassein ’geeignet definiertes Abweichungsmaß’ fur die Residuenminimal wird
Definition 6.17: (Lineare Einfachregression)
Das Regressionsproblem von Folie 293 nennt man lineare Ein-fachregression von Y auf X.
Beispiel:
• Zusammenhang zwischen Ausgaben fur Werbung (X) undden Absatzen (Y ) gemessen an 84 Unternehmen in den USAim Jahr 1990
294
Lineare Einfachregression
295
480
500
520
540
560
0 20 40 60 80 100
Werbeausgaben in Mill. US-$
Abs
atz
in M
ill. U
S-$
Absatz = 502.92 + 0.218 * Werbeausgaben + Fehler
Jetzt:
• ’Sinnvolle Ermittlung’ der Parameter a und b aus den Daten(x1, y1), . . . , (xn, yn)
Dafur zunachst:
• Geeignetes Abweichungsmaß fur die Residuen
ui = yi − (a + b · xi)
(vertikaler Abstand des Datenpunktes (xi, yi) von der Regres-sionsgeraden)
296
Sinnvolles Abstandsmaß ist:
Q(α, β) =n
∑
i=1[yi − (α + β · xi)]
2
Bemerkungen:
• Die Großen α, β ∈ R sind ’formaler Ersatz’ fur die unbekan-nten Parameter a, b
• Die unbekannten Parameter a, b der Regressionsgeraden wer-den gleich durch spezielle Wahlen von α bzw. β ermittelt
297
Jetzt:
• Ermittle a und b durch Minimierung des Abstandsmaßes Q(α, β)bezuglich α und β
Bemerkungen:
• a und b werden also derart gewahlt, dass die Summe derquadrierten Abstande zwischen den Datenpunkten (xi, yi) undder Regressionsgeraden minimal wird
• Die Regressionsgerade yi = a + b · xi beschreibt dann die(xi, yi)-Punktwolke im Sinne des gewahlten Abstandsmaßesoptimal
298
Jetzt:
• Mathematische Bestimmung der Parameter a und b
Formaler Ablauf: [I]
• Bilde die (partiellen) Ableitungen von Q(α, β)
∂∂α
Q(α, β) = 2n
∑
i=1[yi − (α + β · xi)] · (−1)
∂∂β
Q(α, β) = 2n
∑
i=1[yi − (α + β · xi)] · (−xi)
299
Formaler Ablauf: [II]
• Die jeweiligen Nullstellen der partiellen Ableitungen (bezeich-net mit a und b) liefern das potenzielle Minimum (d.h. diegesuchten Parameterwerte)(notwendige Bedingung)
• Es bleibt zu uberprufen, ob die Nullstellen tatsachlich einMinimum darstellen(hinreichende Bedingung)
300
Endergebnisse:
• Die gesuchten Nullstellen ergeben sich als
b =
n∑
i=1xi · yi − n · x · y
n∑
i=1x2
i − n · x2=
sXYs2X
= rXY ·sYsX
,
a = y − b · x
Definition 6.18: (Kleinste-Quadrate-Methode)
Die obige Vorgehensweise zur Bestimmung der Regressionskoef-fizienten a und b nennt man die Methode der Kleinsten Quadrate.
301
Offensichtlich:
• Zur Berechnung der Kleinste-Quadrate-Koeffizienten beno-tigt man nur die 4 Großen x, y, s2X und sXY
302
Bemerkungen:
• Fur die Regressionsgerade gilt also:
y(x) = a + b · x
= y −sXYs2X
· x︸ ︷︷ ︸
= a
+sXYs2X
︸ ︷︷ ︸
= b
·x
Fur die Regresssionsgerade gilt somit:
y(x) = y
=⇒ Die Regressionsgerade verlauft durch den Punkt (x, y)
• Interpretation der Regressionsgeraden nicht fur alle x-Wertesinnvoll
303
Beispiel:
• X = Werbeausgaben, Y = Absatze, n = 84
• Es gilt:
x = 50.7276, y = 513.9912, s2X = 297.5332, sXY = 64.9557
Damit ergibt sich:
b =64.9557297.5332
= 0.2183
a = 513.9912− 0.2183 · 50.7276 = 502.9174
304
Erinnerung:
• Bestimmtheitsmaß B bei Regression 1. Art beschreibt Anteilan der Varianz s2Y , der durch die Regression erklart wird
Jetzt:
• Ubetragung dieses Konzeptes auf Regression 2. Art
Betrachte dazu:
• Werte der Regressionsgerade (yi) an den Stellen xi:
yi = a + b · xi, i = 1, . . . , n
305
Offensichtlich gilt fur die y-Daten:
yi = a + b · xi + ui = yi + ui
Bedeutung:
• Datenwert yi ist Summe aus Wert auf Regressionsgeradenplus Fehler
Nun gilt folgende Varianzzerlegung:
s2Y = s2Y + s2U
306
Fazit:
• Varianz der Y -Werte lasst sich in 2 Teile zerlegen
s2Y : Varianz der exakt auf der Regressionsgeraden liegen-
den Werte yi(den durch die Regression erklarten Teil der Varianz derY -Werte s2Y )
s2U : Varianz der Residuen ui(Residualvarianz oder den durch die Regression nicht er-klarten Teil der Varianz der Y -Werte s2Y )
307
Definition 6.19: (Bestimmtheitsmaß)
Das Bestimmtheitsmaß der deskriptiven Regression 2. Art definiertman als
R2 =s2Ys2Y
= 1−s2Us2Y
.
Bemerkungen: [I]
• Das R2 ist der Anteil an der Varianz der y-Werte, der durchdie Regression erklart wird
• Es gilt:
0 ≤ R2 ≤ 1
308
Bemerkungen: [II]
• R2 = 0:Es ist dann s2U = s2Y , d.h. die Residualvarianz entspricht exaktder Varianz der y-Werte. Die Regression selbst liefert keinenErklarungsbeitrag fur die y-Werte
• R2 = 1:Es ist dann s2Y = s2Y . Die Regression erklart die Varianz dery-Werte vollstandig(Alle Punkte (xi, yi) liegen auf der Regressionsgeraden)
309
Bemerkungen: [III]
• Praktische Berechnungsmoglichkeit:
R2 =
sXY√
s2X ·√
s2Y
2
= (rXY )2
(R2 entspricht dem Quadrat des Korrelationskoeffizientenvon Bravais-Pearson)
310
Beispiel:
• Im Beispiel Werbeausgaben ←→ Absatz gilt:
R2 =
sXY√
s2X ·√
s2Y
2
=
(
64.9557√297.5332 ·
√159.309
)2
= 0.0890
311
6.4 Lineare Mehrfachregression
Jetzt:
• Ubertragung des Konzeptes auf k Regressoren X1, . . . , Xk(alle metrisch)
Regressionsmodell:
yi = a + b1 · x1i + . . . + bk · xki + ui, i = 1, . . . , n
312
Analog zu Abschnitt 6.3.2:
• Kleinste-Quadrate-Methode:
minα,β1,...,βk
Q(α, β1, . . . , βk)
mit
Q(α, β1, . . . , βk) =n
∑
i=1[yi − (α + β1 · x1i + . . . + βk · xki)]
2
• Definition des R2:
R2 =s2Ys2Y
= 1−s2Us2Y
313
7. Konzentrations- und Disparitatsmessung
Betrachte:
• Merkmal X, bei dem alle Daten xi ≥ 0 sind und die Merk-malssumme
∑ni=1 xi eine sinnvolle Interpretation besitzt
(extensives Merkmal)
314
Beispiel:
• X: Haushaltseinkommen
=⇒
Alle xi sind großer oder gleich Null
∑ni=1 xi ist Gesamteinkommen der Population
Fragestellung:
• Wie ist die Merkmalssumme∑n
i=1 xi auf die einzelnen Merk-malstrager verteilt?(Konzentration, Ungleichheit)
315
7.1 Disparitat und Konzentration
Jetzt:
• Klarung der Begriffe
Ungleichheit (= Disparitat)
Konzentration
316
Messung von Disparitat:
• Welcher Anteil der Merkmalssumme fallt auf einen bestimmtenAnteil der Merkmalstrager?
• Beispiel:Welchen Anteil am Gesamteinkommen einer Bevolkerung vere-inigen die 10% Reichsten auf sich?(Anteil des Gesamt-EK ←→ Anteil der Bevolkerung)
317
Messung von Konzentration:
• Welcher Anteil der Merkmalssumme fallt auf eine bestimmteAnzahl von Merkmalstragern?
• Beispiel:Welchen Anteil am Gesamtumsatz eines Industriesektors habendie 5 großten Unternehmen?(Anteil des Gesamtumsatzes ←→ Anzahl von Unternehmen)
318
7.2 Konzentrationsmessung
Wichtige Grundvoraussetzung:
• Die Daten x1, . . . , xn sind absteigend geordnet:
x1 ≥ x2 ≥ . . . ≥ xn ≥ 0
Bemerkungen und Bezeichnungen: [I]
• An dieser Stelle verzichten wir auf die Schreibweise der geord-neten Urliste x(n) ≥ x(n−1) ≥ . . . ≥ x(1) ≥ 0
319
Bemerkungen und Bezeichnungen: [II]
• Stattdessen ordnen wir (notigenfalls) unsere Urliste einfachso um, dass gilt
x1 ≥ x2 ≥ . . . ≥ xn ≥ 0
• Es bezeichne
hr =xr
n∑
i=1xi
=xr
n · x, r = 1, . . . , n
den Merkmalsanteil des r-ten Merkmalstragers an der Merk-malssumme
• Wegen x1 ≥ x2 ≥ . . . ≥ xn ≥ 0 gilt fur die Merkmalsanteile:
h1 ≥ h2 ≥ . . . ≥ hn ≥ 0
320
7.2.1 Konzentrationsraten und Konzentrationskurve
Definition 7.1: (Konzentrationsrate i-ter Ordnung)
Die Summe der i großten Merkmalsanteile,
CR(i) =i
∑
r=1hr =
i∑
r=1xr
n∑
r=1xr
heißt Konzentrationsrate der Ordnung i. CR(i) ist der Merkmal-santeil, der auf die i großten Merkmalstrager entfallt. Fur i = 0wird CR(0) = 0 gesetzt.
321
Definition 7.2: (Konzentrationskurve)
Zeichnet man fur i = 0, . . . , n die Punkte (i, CR(i)) in ein Koordi-natensystem und verbindet man die Punkte durch einen linearenStreckenzug, so erhalt man die Konzentrationskurve.
Bemerkung:
• Per Definition beginnt die Konzentrationskurve im Punkt(0, CR(0)) = (0,0) und endet im Punkt (n, CR(n)) = (n,1).
322
Beispiel: [I]
• Funf Unternehmen eines Marktes weisen die folgenden Umsatzeauf (in Mill. Euro)
x1 = 330, x2 = 120, x3 = 90, x4 = 30, x5 = 30
Man beachte:Die Daten sind bereits absteigend geordnet
323
Beispiel: [II]
• Arbeitstabelle:
i xi hi CR(i)0 01 330 0.55 0.552 120 0.20 0.753 90 0.15 0.904 30 0.05 0.955 30 0.05 1.00∑
600 1.00
324
Beispiel: [III]
• Verbinden der Punkte (i, CR(i)) ergibt die Konzentrationskurve:
325
0
0,2
0,4
0,6
0,8
1
0 1 2 3 4 5
i
CR
(i)
Eigenschaften der Konzentrationskurve: [I]
• Die Konzentrationskurve ist der Graph einer Funktion, diedas Intervall [0, n] auf das Intervall [0,1] abbildet. Die Funk-tion ist stuckweise linear und streng monoton wachsend vomAnfangspunkt (0,0) bis zum Endpunkt (n,1)
• Die Steigung des r-ten Segmentes (r = 1, . . . , n) betragt
CR(r)− CR(r − 1)1
= hr.
Die Steigungen hr nehmen mit wachsendem r ab. Somit istdie Konzentrationskurve konkav
326
Eigenschaften der Konzentrationskurve: [II]
• Der Fall maximaler Konzentration:
Ein Merkmalstrager vereinigt die gesamte Merkmalssummeauf sich:
h1 = 1, h2 = h3 = . . . = hn = 0
Es folgt:
CR(0) = 0, CR(1) = CR(2) = . . . = CR(n) = 1
327
Eigenschaften der Konzentrationskurve: [III]
• Der Fall minimaler Konzentration (egalitare Verteilung):
Jeder Merkmalstrager hat denselben Anteil 1/n an der Merk-malssumme. Es gilt:
h1 = h2 = . . . = hn =1n
Es folgt:
CR(i) =in
, i = 0, . . . , n
328
Offensichtlich gilt:
• Jede Konzentrationskurve liegt zwischen den Extremen dermaximalen Konzentration und der minimalen Konzentration
329
0
0,2
0,4
0,6
0,8
1
0 1 2 3 4 5
i
CR
(i)
Naheliegende Vorgehensweise:
• Benutze die Konzentrationskurven zweier Grundgesamtheiten(Markte) zum Vergleich des Ausmaßes der Konzentration inbeiden Grundgesamtheiten (Markten), z.B. zum Vergleich
der Konzentration eines Merkmals auf ein und demselbenMarkt zu verschiedenen Zeitpunkten(zeitlicher Vergleich der Konzentration)
der Konzentration eines Merkmals auf zwei unterschied-lichen Markten zum gleichen Zeitpunkt(raumlicher Vergleich der Konzentration)
330
Beispiel: [I]
• Umsatze auf 2 Markten:
Markt I:
38,12,106,34,10
Markt II:
25,20,39,7,9
• Man beachte:
Daten mussen zunachst geordnet werden
331
Beispiel: [II]
• Arbeitstabelle:
i xi hi CRI(i) xi hi CRII(i)0 0 01 106 0.53 0.53 39 0.39 0.392 38 0.19 0.72 25 0.25 0.643 34 0.17 0.89 20 0.20 0.844 12 0.06 0.95 9 0.09 0.935 10 0.05 1.00 7 0.07 1.00∑
200 1.00 100 1.00
332
Offensichtlich:
• Markt I weist gleichmaßig hohere Konzentration als Markt IIauf
Haufiges praktisches Problem:
• Konzentrationskurven CRI und CRII schneiden sich
−→ Kein eindeutiger Konzentrationsvergleich moglich
334
Ausweg:
• Beschreibe Konzentrationsausmaß in einer Grundgesamtheitdurch geeignete Zahlen (Indizes)
−→ Eindeutiger Konzentrationsvergleich durch Vergleich vonZahlen ist immer moglich
335
7.2.2 Konzentrationsindizes
Hier nur zwei Indizes:
• Herfindahl- und Rosenbluth-Index
Definition 7.3: (Herfindahl-Index)
Die Summe der quadrierten Merkmalsanteile
KH =n
∑
i=1h2
i
bezeichnet man als Herfindahl-Index.
336
Bemerkungen:
• Der Herfindahl-Index ist normiert. Es gilt
1n≤ KH ≤ 1
• Es gilt KH = 1/n genau dann, wenn minimale Konzentrationvorliegt
• Es gilt KH = 1 genau dann, wenn maximale Konzentrationvorliegt
337
Jetzt:
• Index, der die ’Biegung’ der Konzentrationskurve ausnutzt
Erinnerung:
• Bei maximaler Konzentration ist die Konzentrationskurve ’max-imal gebogen’
• Bei egalitarer Verteilung ist die Konzentrationskurve gar nichtgebogen (sondern eine Gerade)
338
Dehalb:
• Flache A innerhalb des Rechtecks [0, n]× [0,1], die oberhalbder Konzentrationskurve liegt, ist sinnvolle Maßzahl fur dieKonzentration des Merkmals
’Kleines’ A −→ ’hohe Konzentration’
’Großes’ A −→ ’geringe Konzentration’
Jetzt:
• Formale Berechnung des Flacheninhaltes A
339
Zunachst:
• Berechnung der Flacheninhalte A1, . . . , A5
A1 =h1
2= h1 ·
2 · 1− 12
A2 = h2 · 2−12· h2 =
32· h2 = h2 ·
2 · 2− 12
A3 = h3 · 3−12· h3 =
52· h3 = h3 ·
2 · 3− 12
A4 = h4 · 4−12· h4 =
72· h4 = h4 ·
2 · 4− 12
A5 = h5 · 5−12· h5 =
92· h5 = h5 ·
2 · 5− 12
341
Allgemein gilt fur alle i = 1, . . . , n:
Ai = hi ·2i− 1
2
Somit folgt fur den gesuchten Flacheninhalt A:
A =n
∑
i=1Ai =
n∑
i=1hi ·
2i− 12
=n
∑
i=1hi · (i−
12)
=n
∑
i=1hi · i−
12
n∑
i=1hi
=n
∑
i=1hi · i−
12
342
Jetzt:
• Definition eines Konzentrationsindexes basierend auf demFlacheninhalt A
Definition 7.4: (Rosenbluth-Index)
Der Rosenbluth-Index ist definiert als
KR =12A
=1
2n
∑
i=1i · hi
− 1
.
343
Bemerkungen:
• Der Rosenbluth-Index ist normiert. Es gilt
1n≤ KR ≤ 1
• Es gilt KR = 1/n genau dann, wenn minimale Konzentrationvorliegt
• Es gilt KR = 1 genau dann, wenn maximale Konzentrationvorliegt
344
7.3 Disparitatsmessung
Wichtige Grundvoraussetzung:
• Die Daten x1, . . . , xn sind aufsteigend geordnet:
0 ≤ x1 ≤ x2 ≤ . . . ≤ xn
(vgl. Folie 319)
345
Weitere Bezeichnungen:
• Wie bei der Konzentrationsmessung bezeichne
hr =xr
n∑
i=1xi
den Anteil des r-ten Merkmalstragers an der Merkmalssumme
• Wegen 0 ≤ x1 ≤ . . . ≤ xn gilt fur die Merkmalsanteile:
0 ≤ h1 ≤ h2 ≤ . . . ≤ hn
Frage:
• Welchen Anteil an der Merkmalssumme vereinigen bestimmteAnteile der Population auf sich?
346
7.3.1 Lorenzkurve
Definition 7.5: (Lorenzkurve)
Fur i = 1, . . . , n bezeichne
L( i
n
)
=i
∑
r=1hr =
i∑
r=1xr
n∑
r=1xr
den Anteil der i kleinsten Merkmalstrager an der Merkmalssumme.Zeichnet man nun die Punkte
(0,0),(1
n, L
(1n
))
,(2
n, L
(2n
))
, . . . ,(n− 1
n, L
(n− 1n
))
, (1,1)
in ein Koordinatensystem und verbindet man diese durch einenlinearen Streckenzug, so erhalt man die Lorenzkurve der Datenx1, . . . , xn.
347
Bemerkung:
• Die Lorenzkurve ordnet dem Anteil i/n der i kleinsten Merk-malstrager der Population den dazugehorigen MerkmalsanteilL(i/n) an der Grundgesamtheit zu. Die Lorenzkurve tragtsomit zwei Anteile gegeneinander ab
Beispiel: [I] (vgl. Folie 323)
• Funf Unternehmen eines Marktes weisen die folgenden Umsatzeauf (in Mill. Euro)
x1 = 330, x2 = 120, x3 = 90, x4 = 30, x5 = 30
348
Beispiel: [II]
• Umordnung (vom kleinsten zum großten) ergibt folgende Ar-beitstabelle:
i xi hi L( i5) =
∑ir=1 hr
1 30 0.05 0.052 30 0.05 0.103 90 0.15 0.254 120 0.20 0.455 330 0.55 1.00∑
600 1.00
349
Eigenschaften der Lorenzkurve: [I]
• Der Graph der Lorenzkurve befindet sich im Einheitsquadrat.Es gilt L(0) = 0 und L(1) = 1. Die Lorenzkurve ist stuckweiselinear, streng monoton wachsend und konvex.
• Der Fall minimaler Disparitat (absolute Gleichheit):
Gilt x1 = x2 = . . . = xn, so folgt
h1 = h2 = . . . = hn
Dies impliziert
L(i/n) = i/n, i = 0, . . . , n
(Lorenzkurve ist die Diagonale im Einheitsquadrat)
351
Eigenschaften der Lorenzkurve: [II]
• Der Fall maximaler Disparitat (absolute Ungleichheit):
Die gesamte Merkmalssumme entfallt auf einen (den großten)Merkmalstrager:
x1 = x2 = . . . = xn−1 = 0, xn =n
∑
i=1xi
Es folgt
h1 = h2 = . . . = hn−1 = 0, hn = 1
Dies impliziert
L(1
n
)
= L(2
n
)
= . . . = L(n− 1
n
)
= 0, L(1) = 1
(Lorenzkurve ist ’maximal’ gebogen)
352
Es gilt:
• Jede Lorenzkurve liegt zwischen den Extremen der mini-malen Disparitat (absolute Gleichheit) und der maximalenDisparitat (absolute Ungleichheit)
• Wenn sich zwei Lorenzkurven nicht schneiden, weist die hohereLorenzkurve eindeutig weniger Disparitat auf als die niedrigereLorenzkurve
354
Praktisches Problem:
• Lorenzkurven schneiden sich in vielen Fallen
−→ Kein eindeutiger Disparitatsvergleich moglich
Ausweg:
• Beschreibe Ausmaß der Disparitat durch einen Index
−→ Disparitatsvergleich anhand von Zahlen
355
7.3.2 Der Gini-Koeffizient
Bekanntester Disparitatsindex:
• Der Gini-Koeffizient
Intuition:
• Gini-Koeffizient nutzt ’Biegung’ der Lorenzkurve aus
356
Definition 7.6: (Gini-Koeffizient)
Der Gini-Koeffizient (in Zeichen: DG) ist definiert als das Zweifacheder Flache zwischen der Lorenzkurve und der Diagonalen im Ein-heitsquadrat.
Formale Darstellung: [I]
• Es bezeichne B die Flache unterhalb der Lorenzkurve im Ein-heitsquadrat.
Dann gilt:
DG = 2 ·(12−B
)
= 1− 2B
357
Formale Darstellung: [II]
• Man kann zeigen, dass gilt:
B =n
∑
i=1Bi =
n∑
i=1hi ·
2n− 2i + 12n
• Damit folgt
DG = 1− 2B = 1−n
∑
i=1hi ·
2n− 2i + 1n
=n
∑
i=1hi −
n∑
i=1hi ·
2n− 2i + 1n
=n
∑
i=1hi ·
(
1−2n− 2i + 1
n
)
=n
∑
i=1hi ·
2i− n− 1n
359
Bemerkungen:
• Der Gini-Koeffizient ist normiert. Es gilt
0 ≤ DG ≤ 1−1n
• Es gilt DG = 0 genau dann, wenn minimale Disparitat (ab-solute Gleichheit) vorliegt
• Es gilt DG = 1− 1/n genau dann, wenn maximale Disparitat(absolute Ungleichheit) vorliegt
360
top related