vorlesung 9: kumulierte (gepoolte)...
Post on 21-Jul-2018
214 Views
Preview:
TRANSCRIPT
Vorlesung 9: Kumulierte (gepoolte) Querschnittsdaten1. Kumulierte Querschnittsdaten: Was ist das?2. Anwendungsmöglichkeiten im Überblick3. Fallstudie 1: Determinanten von
Erwerbseinkommen 1978-854. Fallstudie 2: Analyse quasi-experimenteller
Daten
• vorher: Nachtrag zur Analyse nicht-linearer Beziehungen und heteroskedastischerFehlerterme (s. Vorlesung 7)
Durchschnittliche Kinderzahl US-amerikanischer Frauen 1972-84
• Datentyp: Zeitreihe• Makrodaten• basiert (wie viele
Zeitreihen) auf einer Serie von Querschnitten
• Quelle: General SocialSurvey (GSS)
• deutsches Pendant: ALLBUS
3.033.21
2.80 2.80 2.82
2.402.24
01
23
mea
n of
kid
s
72 74 76 78 80 82 84
Kumulierte Querschnitte und Zeitreihen
Id Jahr Kids Educ1 72 0 182 72 5 9... ... ... ...
157 74 1 12158 74 2 18... ... ... ...
330 76 3 12331 76 2 12... ... ... ...
482 78 1 20483 78 3 12... ... ... ...
625 80 0 17626 80 1 12... ... ... ...
767 82 3 12768 82 2 12... ... ... ...
953 84 2 12954 84 3 12... ... ... ...
1129 84 2 12
Jahr Kinderzahl72 3.0374 3.2176 2.8078 2.8080 2.8282 2.4084 2.24
KumulierteQuerschnitte
1972-841972: n=1561974: n=1731976: n=1521978: n=1431980: n=1421982: n=1861984: n=177
Zeitreihe
Möglichkeiten der Differenzierung
Id Jahr Kids Educ1 72 0 182 72 5 9... ... ... ...
157 74 1 12158 74 2 18... ... ... ...
330 76 3 12331 76 2 12... ... ... ...
482 78 1 20483 78 3 12... ... ... ...
625 80 0 17626 80 1 12... ... ... ...
767 82 3 12768 82 2 12... ... ... ...
953 84 2 12954 84 3 12... ... ... ...
1129 84 2 12
KumulierteQuerschnitte
1972-841972: n=1561974: n=1731976: n=1521978: n=1431980: n=1421982: n=1861984: n=177
Im Gegensatz zu Zeitreihen (Makro-daten) bieten kumulierte Quer-schnitte Möglich-keiten der Differen-zierung (z.B. nach Ausbildung und anderen Individual-merkmalen)
Eigenschaften kumulierter Querschnitte
• unterschiedliche Stichproben– Person 1 aus 1972 ≠ Person
157 aus 1974• Anordnung wegen der
besseren Lesbarkeit, aber eigentlich unwichtig
• unabhängige Beobachtungen– innerhalb eines Querschnitts– zwischen den Jahren
• Dimension der Datenmatrix– (N1 + N2 + … + NT) ⋅ V
• typisches Beispiel– kumulierter ALLBUS
Id Jahr Kids Educ1 72 0 182 72 5 9... ... ... ...
157 74 1 12158 74 2 18... ... ... ...
330 76 3 12331 76 2 12... ... ... ...
482 78 1 20483 78 3 12... ... ... ...
625 80 0 17626 80 1 12... ... ... ...
767 82 3 12768 82 2 12... ... ... ...
953 84 2 12954 84 3 12... ... ... ...
1129 84 2 12
Nicht verwechseln mit kumulierten Zeitreihen
• Zeitreihen aus N unterschiedlichen Staaten
• Anordnung der Staaten unwichtig, aber innerhalb der Staaten ist die zeitliche Anordnung wichtig
• unabhängige Beobachtungen– zwischen den Staaten– aber nicht innerhalb der Staaten
(Zeitreihe!)• Dimension der Datenmatrix
– N ⋅ T ⋅ V
Staat Datum Unfälle GurtCA Jan. 72 40511 0CA Feb. 72 36034 0... ... ... ...MI Jan. 72 37699 0MI Feb. 72 38816 0... ... ... ...NY Jan. 72 38625 0NY Feb. 72 39539 0... ... ... ...
CO Jan. 72 40676 0CO Feb. 72 39270 0... ... ... ...NJ Jan. 72 36672 0NJ Feb. 72 32699 0... ... ... ...TX Jan. 72 36455 0TX Feb. 72 36690 0... ... ... ...FL Jan. 72 36850 0FL Feb. 72 36284 0... ... ... ...FL Dez. 89 38366 0
Nicht verwechseln mit Panel-Daten
• N Personen werden zu T Zeitpunkten befragt
• pro Person eine Zeitreihe• Anordnung der Personen
unwichtig, aber für jede Person ist die zeitliche Anordnung der Befragungen wichtig
• unabhängige Beobachtungen– zwischen den Personen– aber nicht für jede Person
(Zeitreihe!)• Dimension der Datenmatrix
– N ⋅ T ⋅ V
ID Jahr Kids Educ1 1984 0 121 1985 0 12... ... ... ...2 1984 2 92 1985 2 9... ... ... ...3 1984 0 103 1985 1 11... ... ... ...4 1984 1 84 1985 2 8... ... ... ...5 1984 3 135 1985 3 13... ... ... ...6 1984 2 156 1985 2 15... ... ... ...7 1984 0 97 1985 1 10... ... ... ...7 2000 2 13
Aber ähnliche Datenstruktur bei ländervergleichenden Untersuchungen
• typisches Beispiel– European Social Survey
• unterschiedliche Stichproben– Person 1 aus Land D ≠ Person
157 aus Land NL• Anordnung wegen der
besseren Lesbarkeit, aber eigentlich unwichtig
• unabhängige Beobachtungen– innerhalb eines Querschnitts– zwischen den Ländern
• Dimension der Datenmatrix– (N1 + N2 + … + NL) ⋅ V
ID Land Kids Educ1 D 0 121 D 0 12... ... ... ...2 NL 2 92 NL 2 9... ... ... ...3 GB 0 103 GB 1 11... ... ... ...4 SP 1 84 SP 2 8... ... ... ...5 SWE 3 135 SWE 3 13... ... ... ...6 B 2 156 B 2 15... ... ... ...7 I 0 97 I 1 10... ... ... ...7 I 2 13
Überblick
• Erhöhung der Präzision gegenüber einfachen Querschnitten
• Trendanalysen mit Kontrollvariablen• Analyse des sozialen Wandels• Analyse von Ereignissen und Quasi-
Experimenten
Erhöhung der Präzision gegenüber einfachen Querschnitten• Determinanten der Erwerbseinkommen• Daten: Current Population Survey (US-
amerikanischer Mikrozensus)• Bildungsrendite
–– 1978: 5,2% (t=7,19, n=550)– 1985: 7,7% (t=9,49, n=534)– 1978 + 1985: 6,9% (t=12,08, n=1084)
educwage ⋅+= 10)ln( ββ
Trendanalysen mit Kontrollvariablen
3.0263.2082.8032.8042.817
2.4032.237
01
23
me
an o
f kid
s
72 74 76 78 80 82 84
Durchschnittliche Kinderzahl
0.0830.0580.0460.049
0.070
0.199
0.068
0.0
5.1
.15
.2m
ean
of b
lack
72 74 76 78 80 82 84
Anteil Afro-Amerikaner1
23
unk
orri
gier
t/ko
rrigi
ert
70 75 80 85var1
unkorrigiert korrigiert
Durchschnittliche Anzahl Kinder
Korrelation Black-Kids0,1434
Analyse des sozialen Wandels
• Determinanten der Erwerbseinkommen• Daten: Current Population Survey (US-
amerikanischer Mikrozensus)• Bildungsrendite
–– 1978: 5,2% (t=7,19, n=550)– 1985: 7,7% (t=9,49, n=534)
• Die Bildungsrendite hat sich zwischen 1978 und 1985 signifikant um 2,5 Prozentpunkte erhöht(t=2,30)
educwage ⋅+= 10)ln( ββ
Analyse von Ereignissen und Quasi-Experimenten• Auswirkungen des Baus einer Müllverbrennungsanlage
in North Andover (MA) auf die örtlichen Immobilienpreise– Beginn der öffentlichen Diskussion nach 1978– Baubeginn 1981– Inbetriebnahme 1985
• Daten– Hausverkäufe in 1978 (n=179)– Hausverkäufe in 1981 (n=142)
• Untersuchungsdesign– „Experimental“gruppe: Häuser in der Nähe der Anlage– Kontrollgruppe: alle anderen Häuser– keine Randomisierung (daher: Quasi-Experiment)– aber Kontrolle der (unterschiedlichen) Eigenschaften der Häuser
in beiden Gruppen möglich, wenn entsprechende Informationen mit erfasst werden
Determinanten der Erwerbseinkommen
• Daten: Current Population Survey (US-amerikanischer Mikrozensus)
• kumulierte Querschnittsdaten CPS75_85.dta– 1978: n=550– 1985: n=534
• Analyse s. Handout– getrennt für jedes Jahr– gemeinsam für beide Jahre– Reproduktion der getrennten Analysen in einem
Modell mit Interaktionseffekten
Chow-Test für Strukturunterschiede zwischen Gruppen• Testprinzip: Vergleich eines nicht restringierten
Modells (getrennte Schätzung) mit einem restringierten Modell (gemeinsame Schätzung)
• Oder: gemeinsamer Test der Signifikanz aller Dummies und Interaktionseffekte
• Chow-Test (F-Test) für zwei Gruppen
49,7311
)11(2108496,12654,120
)96,12654,120(18,2811
)1(2)(
21
21
=+
+⋅−×
++−
=
++⋅−
×+
+−=
kkn
SSRSSRSSRSSRSSR
F p
Anwendung des Chow-Testes auf kumulierte Querschnittsdaten• Gruppe = Zeitpunkt• Da in den meisten Fällen von zeitlichen Trends
auszugehen ist, sollten die Unterschiede in den Konstanten (d.h. die Effekte der Dummies) nicht getestet werden.
• Der Test sollte auf die Interaktionseffekte beschränkt werden.
• Lässt sich am besten mit dem Kommando test in Stata umsetzen.
Exkurs: Deflationierung von y• Es häufig sinnvoll, ökonomische Größen für
Zeitvergleiche zu deflationieren• Beispiel Realeinkommen für CPS78_85.dta
– Preisindex 1978: 65,2, 1985: 107,6- 95% gestiegen
– Einkommen aus 1985 in Preisen von 1978- rwage85 = wage85 * (65,2 / 107,6) = wage85 / 1,95- ln(rwage85) = ln(wage85) – ln(1,95)
• Bei Betrachtung logarithmierter y-Variablen ist eigentlich die Deflationierung nicht nötig, da sie sich nur auf die Regressionskonstante für das jeweilige Jahr auswirkt.
Müllverbrennungsanlage in North Andover (MA, USA)• Auswirkungen auf die örtlichen
Immobilienpreise– Ereignis (garbage incinerator) zwischen 1978
und 1981• Daten kielmc.dta
– Hausverkäufe in 1978 (n=179)– Hausverkäufe in 1981 (n=142)
• Analyse s. Handout
Analyseergebnisse• naives Modell für 1981
– Der Effekt von nearinc (obwohl signifikant) ist kein sinnvolles Maß. Häuser in der Nähe der Anlage verkaufen sich einfach billiger (um 30.688,27$).
• zum Vergleich: gleiches Modell für 1978– Auch im Jahr 1978, also vor dem Ereignis, verkaufen sich
Häuser in Nähe billiger (um 18.824,37$).• richtiges Modell (difference-in-differences estimator)
– Wenn die Anlage einen Einfluss hat, dann muss der Preisunterschied zugenommen haben. Was er auch tut, wie der Interaktionseffekt zeigt (nämlich um 11.863,90$).
• Kontrolle der Strukturunterschiede zwischen den Stichproben– Da die Stichprobe 1981 nicht die gleichen Häuser enthält wie die
78er Stichprobe, sollte man deren unterschiedliche Zusammensetzung kontrollieren (z.B. nach Baujahr der Häuser). Hier wird der Interaktionseffekt auch signifikant.
Zusammenfassung
• Chow-TestTest
unabhängige Stichproben aus verschiedenen Zeitpunkten (oder Ländern)
kumulierte Querschnitte
• Dummies (Zeitpunkte, Länder)• Interaktionen (Strukturunterschiede)
Modelle
• höhere Fallzahlen• Trends• Strukturunterschiede• sozialer Wandel• Quasi-Experimente
Analyse-möglichkeiten
Wichtige Fachausdrücke
Chow TestChow-Test
pooled cross-sections
kumulierte Querschnitte
EnglischDeutschEnglischDeutsch
top related