Kapitel 5
Statistische Bewertung von Regressionsbezie-hungen
Hackl, Einführung in die Ökonometrie
2
Einkommen und Konsum
PCR: Privater Konsum, real, in Mrd.EURPYR: Verfügbaren Einkom- men der Haushalte, real1970:1-2003:4
Basis: 1995Quelle: AWM-Datenbasis
200
400
600
800
1000
1200
70 75 80 85 90 95 00
PYR PCR
Hackl, Einführung in die Ökonometrie
3
Einkommen und Konsum: Zuwachsraten
-0.02
0.00
0.02
0.04
0.06
-0.04 -0.02 0.00 0.02 0.04 0.06 0.08
PYR_D4
PC
R_D
4
PCR_D4 vs. PYR_D4
PCR_D4: Privater Konsum, real, ZuwachsratePYR: Verfügbaren Einkom- men der Haushalte, real, Zuwachsrate1970:1-2003:4Basis: 1995Quelle: AWM-Datenbasis
Hackl, Einführung in die Ökonometrie
4
Konsumfunktion
Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000
R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000
Hackl, Einführung in die Ökonometrie
5
Dimensionen der Bewertung
Globale Bewertung: Kann das Modell den datengenerierenden Prozess der abhängigen Variablen als Ganzes erklären?
Globale Kriterien: Bestimmtheitsmaß Adjustiertes Bestimmtheitsmaß Logarithmierte Likelihoodfunktion Informationskriterien, zB Akaike‘s AIC-Kriterium
Inferenz der Regressionsparameter t-Test F-Test ANOVA-Tafel
Hackl, Einführung in die Ökonometrie
6
Residuen
y = X + u = Xb + e = ŷ + e
Residuen: e = y - Xb = y – ŷ = y – X(X‘X)-1X‘y = y - Py
= [I – X(X’X)-1X’]y = My P: Projektionsmatrix M: residuenerzeugende Matrix
Hackl, Einführung in die Ökonometrie
7
Konsumfunktion, Forts.
-0.03
-0.02
-0.01
0.00
0.01
0.02
0.03
-0.02
0.00
0.02
0.04
0.06
75 80 85 90 95 00
Residual Actual Fitted
Hackl, Einführung in die Ökonometrie
8
Schätzer der Varianz 2
ist ein erwartungstreuer Schätzer
Der ML-Schätzer
unterschätzt; der Bias beträgt
2 21 1'tt
s e e en k n k
2 21tte
n
2k
n
Hackl, Einführung in die Ökonometrie
9
Residuen: Eigenschaften
e = y - Xb = y – ŷ = My
Eigenschaften (inhomogene Regression): iei = 0
Achtung! Diese Eigenschaften setzen eine inhomogene Regression voraus!
Streuungszerlegung:
Ergibt sich durch Dividieren durch n und Subtrahieren von
ˆY Y
ˆ ˆ' ' 'y y y y e e 1 2 2 ... k kY b b X b X
2 2 2ˆy y es s s
2Y
Hackl, Einführung in die Ökonometrie
10
Bestimmtheitsmaß
Definition:
Anteil der durch das Regressionsmodell erklärten Varianz (der Varianz der geschätzten Y) an der Gesamtvarianz der Beobachtungen von Y
Anteil der Varianz der abhängigen Variablen, die durch das Modell erklärt wird
oft in Prozenten angegeben
Alternative Schreibweise
2ˆ22
y
y
sR
s
2 2ˆ22 21y e
y y
s sR
s s
Hackl, Einführung in die Ökonometrie
11
R2: Eigenschaften
Wegen gilt:
R2=1 bedeutet: ; alle Residuen sind Null! R2=0 bedeutet:
alle Regressionskoeffizienten haben den Wert Null! R2 soll einen möglichst hohen Wert haben
Einfache Regression: Multiple Regression:
R2 kann durch Hinzufügen eines Regressors nicht kleiner werden!
Achtung! Bei homogener Regression ist R2<0 möglich!
2 2 2ˆy y es s s
20 1R 2 2 2
ˆ , 0y y es s s 2 2 2
ˆ, 0y e ys s s
2 2 2ˆxy yyR r r
2 2ˆyyR r
Hackl, Einführung in die Ökonometrie
12
Beispiel: Konsumfunktion
Dependent Variable: PCR_D4Method: Least SquaresDate: 08/20/04 Time: 11:06Sample(adjusted): 1971:1 2002:4Included observations: 128 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. C 0.010855 0.001053 10.31071 0.0000PYR_D4 0.747032 0.041840 17.85451 0.0000
R-squared 0.716716 Mean dependent var 0.024898Adjusted R-squared 0.714468 S.D. dependent var 0.014817S.E. of regression 0.007918 Akaike info criterion -6.823949Sum squared resid 0.007899 Schwarz criterion -6.779386Log likelihood 438.7327 F-statistic 318.7837Durbin-Watson stat 0.632776 Prob(F-statistic) 0.000000
ys2 2t ete ns
22
2 2
0.007899 0.007861 1 0.716716128 0.0148 0.0148
R
Hackl, Einführung in die Ökonometrie
13
Konsumfunktion
2 2t ete ns
22
2 2
0.007899 0.007861 1 0.716716128 0.0148 0.0148
R
2 2t ete ns
Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000
R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000
2 2t ete ns
22
2 2
0.010061/132 0.008761 1 0.6500.0148 131/132 0.01476
R
ys
Hackl, Einführung in die Ökonometrie
14
R2: Alternative Darstellung
2 2 2ˆy y es s s Aus ergibt sich
2
2 2
( )
ˆ( )
tt
t tt t
TSS Y Y
Y Y e ESS RSS
Es bedeuten: TSS: Gesamtvariation (total sum of squares) ESS: (durch die Regression) erklärte Variation
(explained sum of squares) RSS: residuale (nicht erklärte) Variation (residual
sum of squares)
Wir können schreiben: TSS = y‘M0y, analog ESS, mit0 1
'M In
2ˆ22
1y
y
s ESS RSSR
s TSS TSS
Hackl, Einführung in die Ökonometrie
15
Adjustiertes Bestimmtheitsmaß
Erweiterung eines Modells um einen Regressor: R2 wird größer Zunahme von R2 bedeutet nicht notwendigerweise, dass der neue
Regressor zur Erklärung beiträgt!
Adjustiertes Bestimmtheitsmaß:
Gut zum Vergleichen von Modellen
Bei großem n ist (n-1)/(n-k) ≈ 1
2 11n RSS
Rn k TSS
2 2R R
Hackl, Einführung in die Ökonometrie
16
Andere Kriterien
Meist Funktionen von se2
Logarithmierte Likelihoodfunktion
Akaike‘s Informationskriterium
Schwarz Informationskriterium
2( ) 1 log(2 ) log2 e
nb s
2 ( ) 2b kAIC
n n
2 ( ) logb k nSIC
n n
Hackl, Einführung in die Ökonometrie
17
Konsumfunktion
Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000
R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000
2132( ) 1 log(2 ) log(0.008797)
2b
Hackl, Einführung in die Ökonometrie
18
Konsumfunktion
Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000
R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000
2 ( ) 2b kAIC
n n
Hackl, Einführung in die Ökonometrie
19
Bewertung der Parameter
Frage: Trägt der Regressor Xi zur Erklärung bei? Test von H0: i = 0 gegen H1: i>0 oder H1: i≠0: (t-Test)
Konfidenzintervall für i
Tragen alle Regressoren zur Erklärung bei? Test von H0: 2 = … =k (F-Test)
Hackl, Einführung in die Ökonometrie
20
t-Test
Verteilung der OLS-Schätzer b:
Für den Schätzer bi gilt:
mit dem i-ten Diagonalelement aii aus (X‘X)-1
√(aii) bzw. s√(aii) heißt Standardfehler von bi
Test von H0: i=0 gegen H1: i≠0:
Entscheidung mittels p-Wert:
1 2 1( ' ) ' , ( ' )b X X X u N X X
2( , )i i iib N a
0ii
ii
bp Wert P T
s a
Hackl, Einführung in die Ökonometrie
21
Konsumfunktion
ii
bts a
17.85 0P T
17.85 0P T
Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000
R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000
15.55 0P T
ii
bts a
Hackl, Einführung in die Ökonometrie
22
F-Test
Test von H0: 1=…= k gegen H1: 0 trifft nicht zu
F ist exakt oder näherungsweise verteilt nach F(k-1, n-k)
Entscheidung mittels p-Wert
2
2
ˆ( )
1 1tt
tt
Y Y n k ESS n kF
e k RSS k
Hackl, Einführung in die Ökonometrie
23
Konsumfunktion
Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000
R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000
F-Statistikp-Wert = P{F > 241.79 | H0}
Hackl, Einführung in die Ökonometrie
24
Konfidenzintervall für i
KI zur Konfidenzzahl
mit Perzentil der t(n-k)- oder der Normalverteilung
Beispiel: Konsumfunktion C = + Y + u
95%iges Konfidenzintervall für marginale Konsumneigung
0.7176 – (1.978) (0.0461) ≤ ≤ 0.7176 + (1.978) (0.0461)
oder 0.626 ≤ ≤ 0.809
(1 ) / 2 (1 ) / 2( ) ( )i ii i i iib t n k s a b t n k s a