3. das einfache lineare regressionsmodell okonometrie: (i) · 3. das einfache lineare...

3. Das einfache lineare Regressionsmodell

Okonometrie: (I)

• Anwendung statistischer Methoden in der empirischen For-schung in den Wirtschaftswissenschaften

• Konfrontation okonomischer Theorien mit Fakten(Datenanalyse)

56

Okonometrie: (II)

• Aufgaben der Okonometrie:

1. Okonomisches Modell

Spezifikation:funktional (A-Annahmen)Storgroße (B-Annahmen)Variablen (C-Annahmen)

2. Okonometrisches Modell

Schatzung

57

Okonometrie: (III)

3. Geschatztes Modell

HypothesentestsPrognose

Datenmaterial:

• Empirische Forschung benotigt (gute) Daten

• Datenbeschaffung ist oft ein grundsatzliches Problem(historische Daten vs. Versuchsplane)

• Es gibt keine systematische Anleitung

58

Datentypen:

• Querschnittsdaten(Beobachtungen an verschiedenen Objekten zu einem Zeit-punkt)

• Zeitreihendaten(Beobachtungen uber verschiedene Zeitpunkte hinweg)

• Paneldaten(Mischung aus Querschnitts und Zeitreihendaten)

59

Bedeutung des Begriffes ’Regression’:

• Untersuchung des Zusammenhanges zwischen einer abhangi-gen (endogenen) Variablen y und einer oder mehrerer un-abhangiger (exogener) Variablen

• 1 exogene Variable (x)

−→ einfache Regression

• Mehrere exogene Variablen (x1, . . . , xk)

−→ multiple Regression (vgl. Kapitel 4)

60

Beispiel:

• Rechnungsbetrag xi und Trinkgeld yi (in Euro) an 20 beobachtetenGasten eines Restaurants

i xi yi i xi yi i xi yi i xi yi1 10.00 2.00 6 42.50 6.00 11 60.00 7.00 16 20.00 4.002 30.00 3.00 7 35.00 5.00 12 47.50 5.50 17 47.50 9.003 50.00 7.00 8 40.00 4.00 13 45.00 7.00 18 32.50 3.004 25.00 2.00 9 25.00 6.00 14 27.50 4.50 19 37.50 6.505 7.50 2.50 10 12.50 1.00 15 15.00 1.50 20 20.00 2.50

61

3.1 Modellspezifikation

1. Funktionale Form (A-Annahmen)

Spezifikation in 3 Schritten:

• 1. Schritt: y = f(x), hier zunachst: y = α + βx(’Wahrer’ Zusammenhang zw. Rechnungsbetrag x und Trinkgeld y)

62

0

2

4

6

8

0 20 40 60 8

Rechnungsbetrag

Trin

kgel

d

α

0

Ry

x

β⋅20

20

• 2. Schritt: yi = α + βxi fur i = 1, . . . , N(okonomisches Modell)(Daten des Trinkgeldbeispiels)

63

10yi

8

6

4

2

0

0 20 40 60 80 xi

• 3. Schritt: yi = α + βxi + ui fur i = 1, . . . , N(okonometrisches Modell)

Bemerkungen:

• Die Parameter α und β heißen Regressionsparameter oderRegressionskoeffizienten

• Die Zufallsvariable ui ist eine Storgroße

64

Die A-Annahmen:

• Annahme A1:Im okonometrischen Modell fehlen keine relevanten exoge-nen Variablen und die benutzte exogene Variable xi ist nichtirrelevant

• Annahme A2:Der wahre Zusammenhang zwischen xi und yi ist linear

• Annahme A3:Die Parameter α und β sind fur alle N Beobachtungen (xi, yi)konstant

65

2. Storgroßenspezifikation (B-Annahmen)

Begrundungen fur Storgroße:

• Erhebungs- und Messfehler

• fehlende erklarende Variable

• menschliches Verhalten

66

Die B-Annahmen:• Annahme B1:

Fur i = 1, . . . , N gilt

E(ui) = 0

• Annahme B2:Fur i = 1, . . . , N gilt

V ar(ui) = σ2

• Annahme B3:Fur alle i = 1, . . . , N und j = 1, . . . , N mit i 6= j gilt

Cov(ui, uj) = 0

• Annahme B4:Die Storgroßen ui sind normalverteilt, d.h. ui ∼ N(0, σ2)

67

Veranschaulichung der B-Annahmen

68

3. Variablenspezifikation (C-Annahmen)

Die C-Annahmen:

• Annahme C1:Die exogene Variable xi ist keine Zufallsvariable, sondernkann wie in einem Experiment kontrolliert werden

• Annahme C2:Die exogene Variable xi weist nicht fur alle Beobachtungeni = 1, . . . , N den gleichen Wert auf

69

3.2 (Punkt)Schatzung

Bisher:

• Spezifikation des okonometrischen Modells

yi = α + βxi + ui

Jetzt:

• Herleitung von Schatzern α und β fur die unbekannten Pa-rameter α und β mit der Kleinsten-Quadrate-Methode

70

Dafur:

• Unterscheidung zwischen wahrer und geschatzter Sphare

• Das zum okonometrischen Modell

yi = α + βxi + ui

korrespondierende geschatzte Modell ist

yi = α + βxi

(bei Vorliegen ’geeigneter Schatzer’ α und β)

−→ Begriff des ’Residuums’

71

Definition 3.1: (Residuum)

Unter dem i-ten Residuum (in Zeichen: ui) versteht man dieAbweichung zwischen dem wahren yi und dem geschatzten yi:

ui = yi − yi= yi − α− βxi.

Bemerkungen:

• Das Residuum ui ist nicht zu verwechseln mit der i-ten Stor-große ui, fur die gilt

ui = yi − α− βxi

• ui basiert auf den wahren Parametern α und β, ui auf denParameterschatzungen α und β

72

Idee der KQ-Methode:

• Bestimme die Schatzer α und β fur die unbekannten Param-eter α und β des wahren okonometrischen Modells derart,dass die Residualquadratsumme

N∑

i=1u2

i =N∑

i=1

(

yi − α− βxi)2

minimal wird

73

Satz 3.2: (KQ-Schatzer)

Fur die lineare Einfachregression

yi = α + βxi + ui, i = 1, . . . , n,

ergeben sich die KQ-Schatzer als

β =

N∑

i=1(xi − x)(yi − y)

N∑

i=1(xi − x)2

,

α = y − βx.

(Beweis: Ubung)

74

Bemerkungen:

• Die formale Herleitung der KQ-Schatzer vollzieht sich uber

partielles Ableiten der Residualquadratsumme nach α, β

Gleich-Null-Setzen der partiellen Ableitungen

Auflosen des Gleichungssystems nach α und β

• Die Normalverteilungsannahme (B4) wird bei der Herleitungder KQ-Schatzer nicht benotigt

75

Beispiel: (Trinkgeld) (I)

• x =120

20∑

i=1xi = 31.50, y =

120

20∑

i=1yi = 4.45

•20∑

i=1(xi − x)2 = 4130,

20∑

i=1(xi − x)(yi − y) = 519

−→ β = 519/4130 = 0.125666

−→ α = 4.45− 0.125666 · 31.50 = 0.491521

• Geschatztes Modell:

yi = 0.491521 + 0.125666 · xi

76

Beispiel: (Trinkgeld) (II)

• Residuen:

ui = yi − yi

= yi − 0.491521− 0.125666 · xi

• Residualquadratsumme:

20∑

i=1u2

i = 30.22942

77

10yi

-2

-1

0

1

2

3

0

2

4

6

8

10

2 4 6 8 10 12 14 16 18 20

0

2

4

6

8

0 20 40 60 80xi

Fur das okonometrische Modell gilt:

E(yi) = E(α + βxi + ui)

= E(α) + E(βxi) + E(ui)

= α + βxi

sowie

V ar(yi) = E{

[yi − E(yi)]2}

= E{

[yi − α− βxi]2}

= E(u2i )

= V ar(ui) = σ2

79

Satz 3.3: (Erwartungstreue der KQ-Schatzer)

Unter den A-, B-, C-Annahmen (ohne B4) gilt

E(α) = α,

E(β) = β,

d.h. die KQ-Schatzer sind erwartungstreu. Ferner gilt:

Cov(α, β) = −σ2 x∑N

i=1 (xi − x)2

V ar(α) = σ2[

1N

+x2

∑Ni=1 (xi − x)2

]

V ar(β) =σ2

∑Ni=1 (xi − x)2

.

80

Satz 3.4: (Gauß-Markov-Theorem)

(a) Unter den A-, B-, C-Annahmen (ohne B4) haben die KQ-Schatzer α und β unter allen linearen erwartungstreuen Schat-zern fur α und β die geringste Varianz und sind damit diebesten linearen unverzerrten Schatzer.(BLUE = Best Linear Unbiased Estimators)

(b) Gilt zusatzlich die Normalverteilungsannahme B4 fur die Stor-terme ui, so besitzen die KQ-Schatzer α und β sogar die ger-ingste Varianz in der Menge aller unverzerrten Schatzer furα und β und sind damit die besten unverrzerrten Schatzer.(UMVUE-Schatzer)

81

Bemerkung:

• Mit der Normalverteilungsannahme B4 folgt außerdem

1. fur die Verteilung von yi:

yi ∼ N(α + βxi, σ2) fur alle i = 1, . . . , N

2. fur die Verteilung der KQ-Schatzer:

α ∼ N

(

α, σ2[

1N

+x2

∑Ni=1 (xi − x)2

])

β ∼ N

(

β,σ2

∑Ni=1 (xi − x)2

)

82

Jetzt:

• Maximum-Likelihood-Schatzung des Regressionsmodells

yi = α + βxi + ui

unter allen A-, B-, C-Annahmen, d.h. mit identisch und un-abhangig verteilten

ui ∼ N(0, σ2)

(Beachte: aus B3 und B4 folgt die Unabhangigkeit der ui)

83

Herleitung: (I)

• yi ist eine lineare Funktion von ui

−→ die yi sind unabhangig und

yi ∼ N(α + βxi, σ2)

• Die Dichte von yi ist gegeben durch

fyi(y) =1√2πσ

exp

{

−12

[y − α− βxiσ

]2}

84

Herleitung: (II)

• Die gemeinsame Dichte der endogenen yi ist

fy1,...,yN(y1, . . . , yN) =N∏

i=1fyi(yi)

=N∏

i=1

1√2πσ

exp

{

−12

[yi − α− βxiσ

]2}

=1

(2πσ2)N/2 exp

−1

2σ2

N∑

i=1(yi − α− βxi)

2

• Die Likelihood-Funktion ist damit gegeben durch

L(α, β, σ2) =1

(2πσ2)N/2 exp

−1

2σ2

N∑


2

85

Herleitung: (III)

• Fur die Loglikelihood-Funktion folgt:

L∗(α, β, σ2) = ln[L(α, β, σ2)]

= −N2

ln(2πσ2)−1

2σ2

N∑


2

• Fur gegebenes σ2 wird L∗ bzgl. α und β maximiert, wenn

N∑


2

bzgl. α und β minimiert wird

−→ ML-Schatzer fur α und β sind gleich den KQ-Schatzern

86

Herleitung: (IV)

• Ableiten von L∗ nach σ2 ergibt:

∂ L∗

∂ σ2 = −N2

12πσ22π +

1(2σ2)2

2N∑


2

= −N

2σ2 +1

2σ4

N∑


2

• Nullsetzen und Einsetzen der ML-Schatzer fur α, β ergibt:

−N

2σ2ML

+1

2σ4ML

N∑

i=1

(

yi − αML − βMLxi)2

︸︷︷︸

= u2i

= 0

87

Herleitung: (V)• Auflosen nach σ2

ML ergibt den ML-Schatzer fur σ2:

σ2ML =

1N

N∑

i=1u2

i

Bemerkungen:• Der ML-Schatzer σ2

ML ist verzerrt, denn es gilt

E(

σ2ML

)

=N − 2

Nσ2

• Ein erwartungstreuer Schatzer fur σ2 ist

σ2 =N

N − 2σ2

ML =1

N − 2

N∑

i=1u2

i

88

Bisheriges Fazit: (I)

• KQ-Schatzer fur α und β sind

α = y − βx, β =

N∑

i=1(xi − x)(yi − y)

N∑

i=1(xi − x)2

• Varianzen der KQ-Schatzer sind

V ar(α) = σ2[

1N

+x2

∑Ni=1 (xi − x)2

]

V ar(β) =σ2

∑Ni=1 (xi − x)2

89

Bisheriges Fazit: (II)

• Erwartungstreuer Schatzer fur σ2 ist

σ2 =N

N − 2σ2

ML =1

N − 2

N∑

i=1u2

i

−→ Standardfehler der KQ-Schatzer

90

Definition 3.5: (Standardfehler der KQ-Schatzer)

Ersetzt man in den Varianzformeln der KQ-Schatzer α und β ausSatz 3.3, Folie 80, das unbekannte σ2 durch den erwartungstreuenSchatzer

σ2 =1

N − 2

N∑

i=1u2

i

und zieht man die Wurzel aus den so entstehenden Ausdrucken,so erhalt man die Standardfehler (englisch: standard errors) derKQ-Schatzer:

SE(α) =

√

√

√

√σ2[

1N

+x2

∑Ni=1 (xi − x)2

]

,

SE(β) =

√

√

√

√

σ2∑N

i=1 (xi − x)2.

91

Bemerkung:

• Der Standardfehler eines Schatzers ist also ein Schatzer furdie Standardabweichung des Schatzers und somit eine wichtigeMaßzahl fur die Genauigkeit des Schatzers

92

Beispiel:

• Standardfehler der KQ-Schatzer fur das Trinkgeldbeispiel

93

Dependent Variable: TRINKGELD Method: Least Squares Date: 06/25/04 Time: 21:46 Sample: 1 20 Included observations: 20

Variable Coefficient Std. Error t-Statistic Prob. C 0.491525 0.698181 0.704009 0.4904

RECHNUNG 0.125666 0.020165 6.231803 0.0000R-squared 0.683296 Mean dependent var 4.450000Adjusted R-squared 0.665701 S.D. dependent var 2.241358S.E. of regression 1.295921 Akaike info criterion 3.450960Sum squared resid 30.22942 Schwarz criterion 3.550534Log likelihood -32.50960 F-statistic 38.83536Durbin-Watson stat 2.821560 Prob(F-statistic) 0.000007

Frage:

• Wie gut erklart das (KQ-)geschatzte Modell

yi = α + βxi

die Daten ?

−→ Suche nach einer geeigneten Maßzahl fur den Erklarungsge-halt der Regression(sgeraden)

−→ Das Bestimmtheitsmaß R2

94

Herleitung:

• Variation der endogenen Variablen y

Syy ≡N∑

i=1(yi − y)2

• Residualquadratsumme und erklarte Variation

Suu ≡N∑

i=1u2

i und Syy ≡N∑

i=1

(

yi − y)2

=N∑

i=1(yi − y)2

95

Satz 3.6: (Streuungszerlegungssatz)

Wenn bei einer KQ-Schatzung zwischen der endogenen Variablenyi und der exogenen Variablen xi ein linearer Zusammenhangbesteht (d.h. falls die Annahme A2 wirklich erfullt ist), dann giltfur die Variation der y-Variablen:

Syy = Syy + Suu.

Bemerkung:

• Unter einer KQ-Schatzung lasst sich die gesamte Variationder y-Daten in 2 Komponenten zerlegen:

1. die aus dem Modell (d.h. der Regressionsgeraden) erklarteVariation Syy

2. die aus dem Modell unerklarte Variation Suu

96

Definition 3.7: (Bestimmtheitsmaß)

Das Bestimmtheitsmaß einer linearen Regression ist definiert alsder Anteil der gesamten Variation in den y-Daten, der durch dasModell (d.h. durch die Regressionsgerade) erklart wird:

R2 =erklarte Variationgesamte Variation

=Syy

Syy.

Bemerkungen: (I)

• Aus dem Streuungszerlegungssatz folgt

R2 =Syy

Syy=

Syy − SuuSyy

= 1−SuuSyy

97

Bemerkungen: (II)

• Es gilt stets: 0 ≤ R2 ≤ 1

• R2 = 0:

−→ Syy = 0, d.h. die gesamte Variation der y-Daten wirddurch die Variation der Residuen (ui) bestimmt

−→ Das Modell erklart nichts

• R2 = 1:

−→ Syy = Syy, d.h. die gesamte Variation der y-Daten wirdwird vollstandig durch die Variation der geschatzten Daten(yi) bestimmt

−→ Das Modell erklart alles

98

Bemerkungen: (III)

• Direkte Berechnung des R2 aus den Daten (yi, xi):

R2 =βSxy

Syy=

S2xy

SxxSyy

=1

N2S2xy

1NSxx

1NSyy

=1

(N−1)2S2

xy1

N−1Sxx1

N−1Syy

(Quadrat des empirischen Korrelationskoeffizenten)

99

3.3 Hypothesentests

Betrachte:

• Lineare Einfachregression

yi = α + βxi + ui fur i = 1, . . . , N,

mit ui ∼ N(0, σ2)(Annahme B4)

Jetzt:

• Statistische Hypothesentests uber den Parameter β

• Ein- und zweiseitige Tests zum Signifikanzniveau α

100

Zweiseitiges Testproblem (q ∈ R):

H0 : β = q gegen H1 : β 6= q

Geeignete Teststatistik:

T =β − q

SE(β)

101

Begrundung: (I)• β − q ist Schatzer fur den Abstand zwischen β und q

• Abstandsschatzer sollte auf die Streuung (Standardabwei-chung) von β bezogen werden:

SD(β) ≡√

V ar(β) =

√

√

√

√

σ2∑N

i=1(xi − x)2

• Schatze SD(β) durch den Standardfehler SE(β)

SE(β) =

√

√

√

√

σ2∑N

i=1(xi − x)2

mit

σ2 =1

N − 2

N∑

i=1u2

i

102

Begrundung: (II)

• Verteilung von T unter Gultigkeit von H0 : β = q:

T(unter H0)∼ tN−2

(t−Verteilung mit N − 2 Freiheitsgraden)

−→ Testentscheidung

Testentscheidung:

• Bestimme das (1− α/2)-Quantil der tN−2-Verteilung

• Kritischer Bereich:

(−∞,−tN−2;1−α/2] ∪ [tN−2;1−α/2,+∞)

d.h. lehne H0 ab, falls |T | ≥ tN−2;1−α/2

103

104

Dichte der tN −2-Verteilung

0 (β − q unter H0) tN − 2;1−α / 2

α / 2 α / 2

1−α

− tN − 2;1−α / 2

EViews-Output der Trinkgeld-Regression

105

Dependent Variable: TRINKGELD Method: Least Squares Date: 06/25/04 Time: 21:46 Sample: 1 20 Included observations: 20

Variable Coefficient Std. Error t-Statistic Prob. C 0.491525 0.698181 0.704009 0.4904

RECHNUNG 0.125666 0.020165 6.231803 0.0000R-squared 0.683296 Mean dependent var 4.450000Adjusted R-squared 0.665701 S.D. dependent var 2.241358S.E. of regression 1.295921 Akaike info criterion 3.450960Sum squared resid 30.22942 Schwarz criterion 3.550534Log likelihood -32.50960 F-statistic 38.83536Durbin-Watson stat 2.821560 Prob(F-statistic) 0.000007

Illustration: (Trinkgeldbeispiel) (I)

• H0 : β = 0 gegen H1 : β 6= 0 z. N. α = 0.05

• (Realisierte) Teststatistik:

T =β

SE(β)=

0.1256660.020165

= 6.231803

• (1− α/2)-Quantil der tN−2-Verteilung:

tN−2;1−α/2 = t18;0.975 = 2.1009

• Testentscheidung:

|T | = 6.231803 > 2.1009 = t18;0.975

−→ Lehne H0 zum 5%-Niveau ab(β ist signifikant von Null verschieden)

106

Frage:

• Ist β signifikant von 0.1 verschieden (z.N. α = 0.05)?

Durchfuhrung des Tests: (I)

• H0 : β = 0.1 gegen H1 : β 6= 0.1 zum Niveau α = 0.05


T =β − 0.1SE(β)

=0.0256660.020165

= 1.272799

107

Durchfuhrung des Tests: (II)

• (1− α/2)-Quantil der tN−2-Verteilung:

tN−2;1−α/2 = t18;0.975 = 2.1009


|T | = 1.272799 < 2.1009 = t18;0.975

−→ H0 kann zum 5%-Niveau nicht abgelehnt werden(β nicht signifikant von 0.1 verschieden)

Bemerkung:

• Der Test H0 : β = 0 gegen H1 : β 6= 0 ist standardmaßig inEViews implementiert

108

Jetzt:

• Einseitiger (rechtsseitiger) Hypothesentest zum Niveau α

H0 : β ≤ q gegen H1 : β > q

Vermutung beim rechtsseitigen Test:

• Rechnungsbetrag hat positiven Einfluss auf das Trinkgeld

Geeignete Teststatistik:

T =β − q

SE(β)

109

Begrundung:

• Ist β − q stark positiv, so spricht das fur H1

Testentscheidung:

• Betimme das (1− α)-Quantil der tN−2-Verteilung

tN−2;1−α

• Kritischer Bereich:

[tN−2;1−α,+∞)

d.h. lehne H0 ab, falls

T > tN−2;1−α

110

Illustration: (Trinkgeldbeispiel)

• H0 : β ≤ 0.1 gegen H1 : β > 0.1 zum Niveau α = 0.05


T =β − 0.1SE(β)

=0.0256660.020165

= 1.272799

• (1− α)-Quantil der tN−2-Verteilung:

tN−2;1−α = t18;0.95 = 1.7341


|T | = 1.272799 < 1.7341 = t18;0.95

−→ H0 kann zum 5%-Niveau nicht abgelehnt werden

111

Jetzt:• Wichtiger Test-Begriff beim Umgang mit okonometrischer

Software−→ der p-Wert (engl. p-value, prob-value)

Klassisches Vorgehen bei Hypothesentests:• Lege das Signifikanzniveau α fest (meist: α = 0.05)

• Ermittle den kritischen Bereich (d.h. die Quantile der H0-Verteilung der Teststatistik) anhand des festgelegten Sig-nifikanzniveaus α

• Fuhre den konkreten Test anhand einer Stichprobe durchund entscheide zum Niveau α uber die Ablehnung / Nicht-Ablehnung von H0

112

Alternative Vorgehensweise:

• Lege das Signifikanzniveau α nicht fest, sondern betrachte αals variable Große

• Fuhre den konkreten Test anhand einer Stichprobe durch underhalte die Realisierung t der Teststatistik T

• Ermittle mit dem kritischen Bereich (d.h. mit den Quan-tilen der H0-Verteilung der Teststatistik) das kleinste Sig-nifikanzniveau αmin, das bei der konkreten Beobachtung derRealisation t die Ablehnung von H0 gerade noch erlaubt

113

Definition 3.8: (p-Wert)

Das kleinste Signifikanzniveau αmin, das bei der Beobachtung tder Teststatistik T die Ablehnung der Nullhypothese H0 geradenoch erlaubt, heißt p-Wert.

114

Dichte der tN −2-Verteilung

tN − 2;1−α / 2

T = t

0 (β − q unter H0)

α / 2 α / 2

1−α

− tN − 2;1−α / 2 tN − 2;1−αmin / 2

Beispiel:

• Testproblem

H0 : β = q gegen H1 : β 6= q

• Testentscheidung: Lehne H0 ab, falls

|T | ≥ tN−2;1−α/2

(vgl. Folien 101 ff.)

• Angenommen, Realisierung der Teststatistik ist t

• Bestimme den p-Wert αmin so, dass

|t| = tN−2;1−αmin/2

115

Offensichtlich:

• Wenn H0 zum Niveau αmin abgelehnt wird, dann wird H0auch zu jedem Signifikanzniveau α > αmin abgelehnt−→ Je geringer der p-Wert αmin, desto ’statistisch gesicherter’

kann H0 verworfen werden

• Ist der p-Wert αmin < 0.05, so kann H0 zum 5%-Niveauverworfen werden

• Beim Trinkgeldbeispiel betragt der p-Wert fur den Koeffizien-ten β

αmin = 0.0000

(vgl. Folie 105)−→ Die Nullhypothese H0 : β = 0 kann zu jedem praktisch

gangigen Signifikanzniveau verworfen werden

116

3.4 Prognosen

Jetzt:

• Bedingte Prognose des endogenen Wertes y0 bei bekanntemexogenen Wert x0

Punktprognose mit KQ-Schatzern:

y0 = α + βx0

117


• Es x0 = 20 Euro vorgegeben

• Geschatztes Modell:

yi = 0.491525 + 0.125666xi

−→ Bedingte Punktprognose

y0 = 3.004845

118

Man beachte:

• Tatsachlicher Wert y0 wird sein

y0 = α + βx0 + u0

−→ Prognosefehler

y0 − y0 = (α− α) + (β − β)x0 − u0

Zwei Ursachen fur Prognosefehler:

1. Die Storgroße u0 kann einen von Null verschiedenen Wertannehmen

2. Die KQ-Schatzungen α und β konnen von den wahren Pa-rameterwerten α und β abweichen

119

Verlasslichkeit der Punktprognose: (I)

• Erwartungswert des Prognosefehlers:

E(y0 − y0) = E(α− α) + E(β − β)x0 − E(u0)

= 0

• Varianz des Prognosefehlers:

V ar(y0 − y0) = σ2 ·[

1 +1N

+(x0 − x)2

∑Ni=1(xi − x)2

]

120

Verlasslichkeit der Punktprognose: (II)

• Geschatzte Varianz des Prognosefehlers:

ˆV ar(y0 − y0) = σ2 ·[

1 +1N

+(x0 − x)2

∑Ni=1(xi − x)2

]

mit

σ2 = 1/(N − 2)N∑

i=1u2

i

(vgl. Folie 91)

• Standardfehler des Prognosefehlers:

SE(y0 − y0) =√

ˆV ar(y0 − y0)

121

Illustration: (Trinkgeldbeispiel) (I)

• Fur x0 = 20 war die Punktprognose y0 = 3.004845

• Der Erwartungswert des Prognosefehlers ist 0

• Die Regression liefert:

σ2 = (1.295921)2, x = 31.50,N∑

i=1(xi − x)2 = 4130

(vgl. Output auf Folie 105, Folie 76)

122

Illustration: (Trinkgeldbeispiel) (II)

• Fur die geschatzte Varianz des Prognosefehlers ergibt sich:

ˆV ar(y0 − y0) = (1.295921)2 ·[

1 +120

+(x0 − 31.50)2

4130

]

= 1.817160

• Fur x0 = 100 ergeben sich

als Punktprognose:

y0 = 13.058125

als geschatzte Prognosefehlervarianz:

ˆV ar(y0 − y0) = 2.833062

123

Jetzt:

• Bestimmung eines Prognoseintervalls, das den gesuchten en-dogenen Wert y0 mit vorgegebener Wahrscheinlichkeit enthalt

Schritt 1:

• Betrachte den Prognosefehler

y0 − y0

sowie dessen Standardfehler

SE(y0 − y0) =√

ˆV ar(y0 − y0)

124

Schritt 2:

• Standardisierung des Prognosefehlers

T =(y0 − y0)−

=0︷︸︸︷

E (y0 − y0)SE(y0 − y0)

• Man kann zeigen, dass

T ∼ tN−2

(t-Verteilung mit N − 2 Freiheitsgraden)

125

Schritt 3: (I)

• Formulierung des Prognoseintervalls

• T fallt mit Wskt. 1− α (α ∈ [0,1]), in das Intervall

[−tN−2;1−α/2, tN−2;1−α/2],

d.h.

P

(

−tN−2;1−α/2 ≤y0 − y0

SE(y0 − y0)≤ tN−2;1−α/2

)

= 1− α

126

Schritt 3: (II)

• Auflosen nach y0 ergibt:

P{

y0 − tN−2;1−α/2 · SE(y0 − y0) ≤ y0

≤ y0 + tN−2;1−α/2 · SE(y0 − y0)}

= 1− α

• Das gesuchte Prognoseintervall ist also

[y0 − tN−2;1−α/2 · SE(y0 − y0), y0 + tN−2;1−α/2 · SE(y0 − y0)]

127


• Fur x0 = 20 war die Punktprognose

y0 = 3.004845

• Geschatzte Prognosefehlervarianz war

ˆV ar(y0 − y0) = 1.402215

−→ Fur α = 0.05 ergibt sich das Prognoseintervall

[0.517061,5.492629]

128

Breite des Prognoseintervalls fur y0 in Abhangigkeit von x0

129

)( 002/1;20 yySEty N −⋅+∧

−−∧

αyi

00 xy∧∧∧

+= βα

)( 002/1;20 yySEty N −⋅−∧

−−∧

α

0x

3. das einfache lineare regressionsmodell okonometrie: (i) · 3. das einfache lineare...

Documents