3. das einfache lineare regressionsmodell okonometrie: (i) · 3. das einfache lineare...
TRANSCRIPT
3. Das einfache lineare Regressionsmodell
Okonometrie: (I)
• Anwendung statistischer Methoden in der empirischen For-schung in den Wirtschaftswissenschaften
• Konfrontation okonomischer Theorien mit Fakten(Datenanalyse)
56
Okonometrie: (II)
• Aufgaben der Okonometrie:
1. Okonomisches Modell
Spezifikation:funktional (A-Annahmen)Storgroße (B-Annahmen)Variablen (C-Annahmen)
2. Okonometrisches Modell
Schatzung
57
Okonometrie: (III)
3. Geschatztes Modell
HypothesentestsPrognose
Datenmaterial:
• Empirische Forschung benotigt (gute) Daten
• Datenbeschaffung ist oft ein grundsatzliches Problem(historische Daten vs. Versuchsplane)
• Es gibt keine systematische Anleitung
58
Datentypen:
• Querschnittsdaten(Beobachtungen an verschiedenen Objekten zu einem Zeit-punkt)
• Zeitreihendaten(Beobachtungen uber verschiedene Zeitpunkte hinweg)
• Paneldaten(Mischung aus Querschnitts und Zeitreihendaten)
59
Bedeutung des Begriffes ’Regression’:
• Untersuchung des Zusammenhanges zwischen einer abhangi-gen (endogenen) Variablen y und einer oder mehrerer un-abhangiger (exogener) Variablen
• 1 exogene Variable (x)
−→ einfache Regression
• Mehrere exogene Variablen (x1, . . . , xk)
−→ multiple Regression (vgl. Kapitel 4)
60
Beispiel:
• Rechnungsbetrag xi und Trinkgeld yi (in Euro) an 20 beobachtetenGasten eines Restaurants
i xi yi i xi yi i xi yi i xi yi1 10.00 2.00 6 42.50 6.00 11 60.00 7.00 16 20.00 4.002 30.00 3.00 7 35.00 5.00 12 47.50 5.50 17 47.50 9.003 50.00 7.00 8 40.00 4.00 13 45.00 7.00 18 32.50 3.004 25.00 2.00 9 25.00 6.00 14 27.50 4.50 19 37.50 6.505 7.50 2.50 10 12.50 1.00 15 15.00 1.50 20 20.00 2.50
61
3.1 Modellspezifikation
1. Funktionale Form (A-Annahmen)
Spezifikation in 3 Schritten:
• 1. Schritt: y = f(x), hier zunachst: y = α + βx(’Wahrer’ Zusammenhang zw. Rechnungsbetrag x und Trinkgeld y)
62
0
2
4
6
8
0 20 40 60 8
Rechnungsbetrag
Trin
kgel
d
α
0
Ry
x
β⋅20
20
• 2. Schritt: yi = α + βxi fur i = 1, . . . , N(okonomisches Modell)(Daten des Trinkgeldbeispiels)
63
10yi
8
6
4
2
0
0 20 40 60 80 xi
• 3. Schritt: yi = α + βxi + ui fur i = 1, . . . , N(okonometrisches Modell)
Bemerkungen:
• Die Parameter α und β heißen Regressionsparameter oderRegressionskoeffizienten
• Die Zufallsvariable ui ist eine Storgroße
64
Die A-Annahmen:
• Annahme A1:Im okonometrischen Modell fehlen keine relevanten exoge-nen Variablen und die benutzte exogene Variable xi ist nichtirrelevant
• Annahme A2:Der wahre Zusammenhang zwischen xi und yi ist linear
• Annahme A3:Die Parameter α und β sind fur alle N Beobachtungen (xi, yi)konstant
65
2. Storgroßenspezifikation (B-Annahmen)
Begrundungen fur Storgroße:
• Erhebungs- und Messfehler
• fehlende erklarende Variable
• menschliches Verhalten
66
Die B-Annahmen:• Annahme B1:
Fur i = 1, . . . , N gilt
E(ui) = 0
• Annahme B2:Fur i = 1, . . . , N gilt
V ar(ui) = σ2
• Annahme B3:Fur alle i = 1, . . . , N und j = 1, . . . , N mit i 6= j gilt
Cov(ui, uj) = 0
• Annahme B4:Die Storgroßen ui sind normalverteilt, d.h. ui ∼ N(0, σ2)
67
Veranschaulichung der B-Annahmen
68
3. Variablenspezifikation (C-Annahmen)
Die C-Annahmen:
• Annahme C1:Die exogene Variable xi ist keine Zufallsvariable, sondernkann wie in einem Experiment kontrolliert werden
• Annahme C2:Die exogene Variable xi weist nicht fur alle Beobachtungeni = 1, . . . , N den gleichen Wert auf
69
3.2 (Punkt)Schatzung
Bisher:
• Spezifikation des okonometrischen Modells
yi = α + βxi + ui
Jetzt:
• Herleitung von Schatzern α und β fur die unbekannten Pa-rameter α und β mit der Kleinsten-Quadrate-Methode
70
Dafur:
• Unterscheidung zwischen wahrer und geschatzter Sphare
• Das zum okonometrischen Modell
yi = α + βxi + ui
korrespondierende geschatzte Modell ist
yi = α + βxi
(bei Vorliegen ’geeigneter Schatzer’ α und β)
−→ Begriff des ’Residuums’
71
Definition 3.1: (Residuum)
Unter dem i-ten Residuum (in Zeichen: ui) versteht man dieAbweichung zwischen dem wahren yi und dem geschatzten yi:
ui = yi − yi= yi − α− βxi.
Bemerkungen:
• Das Residuum ui ist nicht zu verwechseln mit der i-ten Stor-große ui, fur die gilt
ui = yi − α− βxi
• ui basiert auf den wahren Parametern α und β, ui auf denParameterschatzungen α und β
72
Idee der KQ-Methode:
• Bestimme die Schatzer α und β fur die unbekannten Param-eter α und β des wahren okonometrischen Modells derart,dass die Residualquadratsumme
N∑
i=1u2
i =N∑
i=1
(
yi − α− βxi)2
minimal wird
73
Satz 3.2: (KQ-Schatzer)
Fur die lineare Einfachregression
yi = α + βxi + ui, i = 1, . . . , n,
ergeben sich die KQ-Schatzer als
β =
N∑
i=1(xi − x)(yi − y)
N∑
i=1(xi − x)2
,
α = y − βx.
(Beweis: Ubung)
74
Bemerkungen:
• Die formale Herleitung der KQ-Schatzer vollzieht sich uber
partielles Ableiten der Residualquadratsumme nach α, β
Gleich-Null-Setzen der partiellen Ableitungen
Auflosen des Gleichungssystems nach α und β
• Die Normalverteilungsannahme (B4) wird bei der Herleitungder KQ-Schatzer nicht benotigt
75
Beispiel: (Trinkgeld) (I)
• x =120
20∑
i=1xi = 31.50, y =
120
20∑
i=1yi = 4.45
•20∑
i=1(xi − x)2 = 4130,
20∑
i=1(xi − x)(yi − y) = 519
−→ β = 519/4130 = 0.125666
−→ α = 4.45− 0.125666 · 31.50 = 0.491521
• Geschatztes Modell:
yi = 0.491521 + 0.125666 · xi
76
Beispiel: (Trinkgeld) (II)
• Residuen:
ui = yi − yi
= yi − 0.491521− 0.125666 · xi
• Residualquadratsumme:
20∑
i=1u2
i = 30.22942
77
10yi
-2
-1
0
1
2
3
0
2
4
6
8
10
2 4 6 8 10 12 14 16 18 20
0
2
4
6
8
0 20 40 60 80xi
Fur das okonometrische Modell gilt:
E(yi) = E(α + βxi + ui)
= E(α) + E(βxi) + E(ui)
= α + βxi
sowie
V ar(yi) = E{
[yi − E(yi)]2}
= E{
[yi − α− βxi]2}
= E(u2i )
= V ar(ui) = σ2
79
Satz 3.3: (Erwartungstreue der KQ-Schatzer)
Unter den A-, B-, C-Annahmen (ohne B4) gilt
E(α) = α,
E(β) = β,
d.h. die KQ-Schatzer sind erwartungstreu. Ferner gilt:
Cov(α, β) = −σ2 x∑N
i=1 (xi − x)2
V ar(α) = σ2[
1N
+x2
∑Ni=1 (xi − x)2
]
V ar(β) =σ2
∑Ni=1 (xi − x)2
.
80
Satz 3.4: (Gauß-Markov-Theorem)
(a) Unter den A-, B-, C-Annahmen (ohne B4) haben die KQ-Schatzer α und β unter allen linearen erwartungstreuen Schat-zern fur α und β die geringste Varianz und sind damit diebesten linearen unverzerrten Schatzer.(BLUE = Best Linear Unbiased Estimators)
(b) Gilt zusatzlich die Normalverteilungsannahme B4 fur die Stor-terme ui, so besitzen die KQ-Schatzer α und β sogar die ger-ingste Varianz in der Menge aller unverzerrten Schatzer furα und β und sind damit die besten unverrzerrten Schatzer.(UMVUE-Schatzer)
81
Bemerkung:
• Mit der Normalverteilungsannahme B4 folgt außerdem
1. fur die Verteilung von yi:
yi ∼ N(α + βxi, σ2) fur alle i = 1, . . . , N
2. fur die Verteilung der KQ-Schatzer:
α ∼ N
(
α, σ2[
1N
+x2
∑Ni=1 (xi − x)2
])
β ∼ N
(
β,σ2
∑Ni=1 (xi − x)2
)
82
Jetzt:
• Maximum-Likelihood-Schatzung des Regressionsmodells
yi = α + βxi + ui
unter allen A-, B-, C-Annahmen, d.h. mit identisch und un-abhangig verteilten
ui ∼ N(0, σ2)
(Beachte: aus B3 und B4 folgt die Unabhangigkeit der ui)
83
Herleitung: (I)
• yi ist eine lineare Funktion von ui
−→ die yi sind unabhangig und
yi ∼ N(α + βxi, σ2)
• Die Dichte von yi ist gegeben durch
fyi(y) =1√2πσ
exp
{
−12
[y − α− βxiσ
]2}
84
Herleitung: (II)
• Die gemeinsame Dichte der endogenen yi ist
fy1,...,yN(y1, . . . , yN) =N∏
i=1fyi(yi)
=N∏
i=1
1√2πσ
exp
{
−12
[yi − α− βxiσ
]2}
=1
(2πσ2)N/2 exp
−1
2σ2
N∑
i=1(yi − α− βxi)
2
• Die Likelihood-Funktion ist damit gegeben durch
L(α, β, σ2) =1
(2πσ2)N/2 exp
−1
2σ2
N∑
i=1(yi − α− βxi)
2
85
Herleitung: (III)
• Fur die Loglikelihood-Funktion folgt:
L∗(α, β, σ2) = ln[L(α, β, σ2)]
= −N2
ln(2πσ2)−1
2σ2
N∑
i=1(yi − α− βxi)
2
• Fur gegebenes σ2 wird L∗ bzgl. α und β maximiert, wenn
N∑
i=1(yi − α− βxi)
2
bzgl. α und β minimiert wird
−→ ML-Schatzer fur α und β sind gleich den KQ-Schatzern
86
Herleitung: (IV)
• Ableiten von L∗ nach σ2 ergibt:
∂ L∗
∂ σ2 = −N2
12πσ22π +
1(2σ2)2
2N∑
i=1(yi − α− βxi)
2
= −N
2σ2 +1
2σ4
N∑
i=1(yi − α− βxi)
2
• Nullsetzen und Einsetzen der ML-Schatzer fur α, β ergibt:
−N
2σ2ML
+1
2σ4ML
N∑
i=1
(
yi − αML − βMLxi)2
︸ ︷︷ ︸
= u2i
= 0
87
Herleitung: (V)• Auflosen nach σ2
ML ergibt den ML-Schatzer fur σ2:
σ2ML =
1N
N∑
i=1u2
i
Bemerkungen:• Der ML-Schatzer σ2
ML ist verzerrt, denn es gilt
E(
σ2ML
)
=N − 2
Nσ2
• Ein erwartungstreuer Schatzer fur σ2 ist
σ2 =N
N − 2σ2
ML =1
N − 2
N∑
i=1u2
i
88
Bisheriges Fazit: (I)
• KQ-Schatzer fur α und β sind
α = y − βx, β =
N∑
i=1(xi − x)(yi − y)
N∑
i=1(xi − x)2
• Varianzen der KQ-Schatzer sind
V ar(α) = σ2[
1N
+x2
∑Ni=1 (xi − x)2
]
V ar(β) =σ2
∑Ni=1 (xi − x)2
89
Bisheriges Fazit: (II)
• Erwartungstreuer Schatzer fur σ2 ist
σ2 =N
N − 2σ2
ML =1
N − 2
N∑
i=1u2
i
−→ Standardfehler der KQ-Schatzer
90
Definition 3.5: (Standardfehler der KQ-Schatzer)
Ersetzt man in den Varianzformeln der KQ-Schatzer α und β ausSatz 3.3, Folie 80, das unbekannte σ2 durch den erwartungstreuenSchatzer
σ2 =1
N − 2
N∑
i=1u2
i
und zieht man die Wurzel aus den so entstehenden Ausdrucken,so erhalt man die Standardfehler (englisch: standard errors) derKQ-Schatzer:
SE(α) =
√
√
√
√σ2[
1N
+x2
∑Ni=1 (xi − x)2
]
,
SE(β) =
√
√
√
√
σ2∑N
i=1 (xi − x)2.
91
Bemerkung:
• Der Standardfehler eines Schatzers ist also ein Schatzer furdie Standardabweichung des Schatzers und somit eine wichtigeMaßzahl fur die Genauigkeit des Schatzers
92
Beispiel:
• Standardfehler der KQ-Schatzer fur das Trinkgeldbeispiel
93
Dependent Variable: TRINKGELD Method: Least Squares Date: 06/25/04 Time: 21:46 Sample: 1 20 Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob. C 0.491525 0.698181 0.704009 0.4904
RECHNUNG 0.125666 0.020165 6.231803 0.0000R-squared 0.683296 Mean dependent var 4.450000Adjusted R-squared 0.665701 S.D. dependent var 2.241358S.E. of regression 1.295921 Akaike info criterion 3.450960Sum squared resid 30.22942 Schwarz criterion 3.550534Log likelihood -32.50960 F-statistic 38.83536Durbin-Watson stat 2.821560 Prob(F-statistic) 0.000007
Frage:
• Wie gut erklart das (KQ-)geschatzte Modell
yi = α + βxi
die Daten ?
−→ Suche nach einer geeigneten Maßzahl fur den Erklarungsge-halt der Regression(sgeraden)
−→ Das Bestimmtheitsmaß R2
94
Herleitung:
• Variation der endogenen Variablen y
Syy ≡N∑
i=1(yi − y)2
• Residualquadratsumme und erklarte Variation
Suu ≡N∑
i=1u2
i und Syy ≡N∑
i=1
(
yi − y)2
=N∑
i=1(yi − y)2
95
Satz 3.6: (Streuungszerlegungssatz)
Wenn bei einer KQ-Schatzung zwischen der endogenen Variablenyi und der exogenen Variablen xi ein linearer Zusammenhangbesteht (d.h. falls die Annahme A2 wirklich erfullt ist), dann giltfur die Variation der y-Variablen:
Syy = Syy + Suu.
Bemerkung:
• Unter einer KQ-Schatzung lasst sich die gesamte Variationder y-Daten in 2 Komponenten zerlegen:
1. die aus dem Modell (d.h. der Regressionsgeraden) erklarteVariation Syy
2. die aus dem Modell unerklarte Variation Suu
96
Definition 3.7: (Bestimmtheitsmaß)
Das Bestimmtheitsmaß einer linearen Regression ist definiert alsder Anteil der gesamten Variation in den y-Daten, der durch dasModell (d.h. durch die Regressionsgerade) erklart wird:
R2 =erklarte Variationgesamte Variation
=Syy
Syy.
Bemerkungen: (I)
• Aus dem Streuungszerlegungssatz folgt
R2 =Syy
Syy=
Syy − SuuSyy
= 1−SuuSyy
97
Bemerkungen: (II)
• Es gilt stets: 0 ≤ R2 ≤ 1
• R2 = 0:
−→ Syy = 0, d.h. die gesamte Variation der y-Daten wirddurch die Variation der Residuen (ui) bestimmt
−→ Das Modell erklart nichts
• R2 = 1:
−→ Syy = Syy, d.h. die gesamte Variation der y-Daten wirdwird vollstandig durch die Variation der geschatzten Daten(yi) bestimmt
−→ Das Modell erklart alles
98
Bemerkungen: (III)
• Direkte Berechnung des R2 aus den Daten (yi, xi):
R2 =βSxy
Syy=
S2xy
SxxSyy
=1
N2S2xy
1NSxx
1NSyy
=1
(N−1)2S2
xy1
N−1Sxx1
N−1Syy
(Quadrat des empirischen Korrelationskoeffizenten)
99
3.3 Hypothesentests
Betrachte:
• Lineare Einfachregression
yi = α + βxi + ui fur i = 1, . . . , N,
mit ui ∼ N(0, σ2)(Annahme B4)
Jetzt:
• Statistische Hypothesentests uber den Parameter β
• Ein- und zweiseitige Tests zum Signifikanzniveau α
100
Zweiseitiges Testproblem (q ∈ R):
H0 : β = q gegen H1 : β 6= q
Geeignete Teststatistik:
T =β − q
SE(β)
101
Begrundung: (I)• β − q ist Schatzer fur den Abstand zwischen β und q
• Abstandsschatzer sollte auf die Streuung (Standardabwei-chung) von β bezogen werden:
SD(β) ≡√
V ar(β) =
√
√
√
√
σ2∑N
i=1(xi − x)2
• Schatze SD(β) durch den Standardfehler SE(β)
SE(β) =
√
√
√
√
σ2∑N
i=1(xi − x)2
mit
σ2 =1
N − 2
N∑
i=1u2
i
102
Begrundung: (II)
• Verteilung von T unter Gultigkeit von H0 : β = q:
T(unter H0)∼ tN−2
(t−Verteilung mit N − 2 Freiheitsgraden)
−→ Testentscheidung
Testentscheidung:
• Bestimme das (1− α/2)-Quantil der tN−2-Verteilung
• Kritischer Bereich:
(−∞,−tN−2;1−α/2] ∪ [tN−2;1−α/2,+∞)
d.h. lehne H0 ab, falls |T | ≥ tN−2;1−α/2
103
104
Dichte der tN −2-Verteilung
0 (β − q unter H0) tN − 2;1−α / 2
α / 2 α / 2
1−α
− tN − 2;1−α / 2
EViews-Output der Trinkgeld-Regression
105
Dependent Variable: TRINKGELD Method: Least Squares Date: 06/25/04 Time: 21:46 Sample: 1 20 Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob. C 0.491525 0.698181 0.704009 0.4904
RECHNUNG 0.125666 0.020165 6.231803 0.0000R-squared 0.683296 Mean dependent var 4.450000Adjusted R-squared 0.665701 S.D. dependent var 2.241358S.E. of regression 1.295921 Akaike info criterion 3.450960Sum squared resid 30.22942 Schwarz criterion 3.550534Log likelihood -32.50960 F-statistic 38.83536Durbin-Watson stat 2.821560 Prob(F-statistic) 0.000007
Illustration: (Trinkgeldbeispiel) (I)
• H0 : β = 0 gegen H1 : β 6= 0 z. N. α = 0.05
• (Realisierte) Teststatistik:
T =β
SE(β)=
0.1256660.020165
= 6.231803
• (1− α/2)-Quantil der tN−2-Verteilung:
tN−2;1−α/2 = t18;0.975 = 2.1009
• Testentscheidung:
|T | = 6.231803 > 2.1009 = t18;0.975
−→ Lehne H0 zum 5%-Niveau ab(β ist signifikant von Null verschieden)
106
Frage:
• Ist β signifikant von 0.1 verschieden (z.N. α = 0.05)?
Durchfuhrung des Tests: (I)
• H0 : β = 0.1 gegen H1 : β 6= 0.1 zum Niveau α = 0.05
• (Realisierte) Teststatistik:
T =β − 0.1SE(β)
=0.0256660.020165
= 1.272799
107
Durchfuhrung des Tests: (II)
• (1− α/2)-Quantil der tN−2-Verteilung:
tN−2;1−α/2 = t18;0.975 = 2.1009
• Testentscheidung:
|T | = 1.272799 < 2.1009 = t18;0.975
−→ H0 kann zum 5%-Niveau nicht abgelehnt werden(β nicht signifikant von 0.1 verschieden)
Bemerkung:
• Der Test H0 : β = 0 gegen H1 : β 6= 0 ist standardmaßig inEViews implementiert
108
Jetzt:
• Einseitiger (rechtsseitiger) Hypothesentest zum Niveau α
H0 : β ≤ q gegen H1 : β > q
Vermutung beim rechtsseitigen Test:
• Rechnungsbetrag hat positiven Einfluss auf das Trinkgeld
Geeignete Teststatistik:
T =β − q
SE(β)
109
Begrundung:
• Ist β − q stark positiv, so spricht das fur H1
Testentscheidung:
• Betimme das (1− α)-Quantil der tN−2-Verteilung
tN−2;1−α
• Kritischer Bereich:
[tN−2;1−α,+∞)
d.h. lehne H0 ab, falls
T > tN−2;1−α
110
Illustration: (Trinkgeldbeispiel)
• H0 : β ≤ 0.1 gegen H1 : β > 0.1 zum Niveau α = 0.05
• (Realisierte) Teststatistik:
T =β − 0.1SE(β)
=0.0256660.020165
= 1.272799
• (1− α)-Quantil der tN−2-Verteilung:
tN−2;1−α = t18;0.95 = 1.7341
• Testentscheidung:
|T | = 1.272799 < 1.7341 = t18;0.95
−→ H0 kann zum 5%-Niveau nicht abgelehnt werden
111
Jetzt:• Wichtiger Test-Begriff beim Umgang mit okonometrischer
Software−→ der p-Wert (engl. p-value, prob-value)
Klassisches Vorgehen bei Hypothesentests:• Lege das Signifikanzniveau α fest (meist: α = 0.05)
• Ermittle den kritischen Bereich (d.h. die Quantile der H0-Verteilung der Teststatistik) anhand des festgelegten Sig-nifikanzniveaus α
• Fuhre den konkreten Test anhand einer Stichprobe durchund entscheide zum Niveau α uber die Ablehnung / Nicht-Ablehnung von H0
112
Alternative Vorgehensweise:
• Lege das Signifikanzniveau α nicht fest, sondern betrachte αals variable Große
• Fuhre den konkreten Test anhand einer Stichprobe durch underhalte die Realisierung t der Teststatistik T
• Ermittle mit dem kritischen Bereich (d.h. mit den Quan-tilen der H0-Verteilung der Teststatistik) das kleinste Sig-nifikanzniveau αmin, das bei der konkreten Beobachtung derRealisation t die Ablehnung von H0 gerade noch erlaubt
113
Definition 3.8: (p-Wert)
Das kleinste Signifikanzniveau αmin, das bei der Beobachtung tder Teststatistik T die Ablehnung der Nullhypothese H0 geradenoch erlaubt, heißt p-Wert.
114
Dichte der tN −2-Verteilung
tN − 2;1−α / 2
T = t
0 (β − q unter H0)
α / 2 α / 2
1−α
− tN − 2;1−α / 2 tN − 2;1−αmin / 2
Beispiel:
• Testproblem
H0 : β = q gegen H1 : β 6= q
• Testentscheidung: Lehne H0 ab, falls
|T | ≥ tN−2;1−α/2
(vgl. Folien 101 ff.)
• Angenommen, Realisierung der Teststatistik ist t
• Bestimme den p-Wert αmin so, dass
|t| = tN−2;1−αmin/2
115
Offensichtlich:
• Wenn H0 zum Niveau αmin abgelehnt wird, dann wird H0auch zu jedem Signifikanzniveau α > αmin abgelehnt−→ Je geringer der p-Wert αmin, desto ’statistisch gesicherter’
kann H0 verworfen werden
• Ist der p-Wert αmin < 0.05, so kann H0 zum 5%-Niveauverworfen werden
• Beim Trinkgeldbeispiel betragt der p-Wert fur den Koeffizien-ten β
αmin = 0.0000
(vgl. Folie 105)−→ Die Nullhypothese H0 : β = 0 kann zu jedem praktisch
gangigen Signifikanzniveau verworfen werden
116
3.4 Prognosen
Jetzt:
• Bedingte Prognose des endogenen Wertes y0 bei bekanntemexogenen Wert x0
Punktprognose mit KQ-Schatzern:
y0 = α + βx0
117
Illustration: (Trinkgeldbeispiel)
• Es x0 = 20 Euro vorgegeben
• Geschatztes Modell:
yi = 0.491525 + 0.125666xi
−→ Bedingte Punktprognose
y0 = 3.004845
118
Man beachte:
• Tatsachlicher Wert y0 wird sein
y0 = α + βx0 + u0
−→ Prognosefehler
y0 − y0 = (α− α) + (β − β)x0 − u0
Zwei Ursachen fur Prognosefehler:
1. Die Storgroße u0 kann einen von Null verschiedenen Wertannehmen
2. Die KQ-Schatzungen α und β konnen von den wahren Pa-rameterwerten α und β abweichen
119
Verlasslichkeit der Punktprognose: (I)
• Erwartungswert des Prognosefehlers:
E(y0 − y0) = E(α− α) + E(β − β)x0 − E(u0)
= 0
• Varianz des Prognosefehlers:
V ar(y0 − y0) = σ2 ·[
1 +1N
+(x0 − x)2
∑Ni=1(xi − x)2
]
120
Verlasslichkeit der Punktprognose: (II)
• Geschatzte Varianz des Prognosefehlers:
ˆV ar(y0 − y0) = σ2 ·[
1 +1N
+(x0 − x)2
∑Ni=1(xi − x)2
]
mit
σ2 = 1/(N − 2)N∑
i=1u2
i
(vgl. Folie 91)
• Standardfehler des Prognosefehlers:
SE(y0 − y0) =√
ˆV ar(y0 − y0)
121
Illustration: (Trinkgeldbeispiel) (I)
• Fur x0 = 20 war die Punktprognose y0 = 3.004845
• Der Erwartungswert des Prognosefehlers ist 0
• Die Regression liefert:
σ2 = (1.295921)2, x = 31.50,N∑
i=1(xi − x)2 = 4130
(vgl. Output auf Folie 105, Folie 76)
122
Illustration: (Trinkgeldbeispiel) (II)
• Fur die geschatzte Varianz des Prognosefehlers ergibt sich:
ˆV ar(y0 − y0) = (1.295921)2 ·[
1 +120
+(x0 − 31.50)2
4130
]
= 1.817160
• Fur x0 = 100 ergeben sich
als Punktprognose:
y0 = 13.058125
als geschatzte Prognosefehlervarianz:
ˆV ar(y0 − y0) = 2.833062
123
Jetzt:
• Bestimmung eines Prognoseintervalls, das den gesuchten en-dogenen Wert y0 mit vorgegebener Wahrscheinlichkeit enthalt
Schritt 1:
• Betrachte den Prognosefehler
y0 − y0
sowie dessen Standardfehler
SE(y0 − y0) =√
ˆV ar(y0 − y0)
124
Schritt 2:
• Standardisierung des Prognosefehlers
T =(y0 − y0)−
=0︷ ︸︸ ︷
E (y0 − y0)SE(y0 − y0)
• Man kann zeigen, dass
T ∼ tN−2
(t-Verteilung mit N − 2 Freiheitsgraden)
125
Schritt 3: (I)
• Formulierung des Prognoseintervalls
• T fallt mit Wskt. 1− α (α ∈ [0,1]), in das Intervall
[−tN−2;1−α/2, tN−2;1−α/2],
d.h.
P
(
−tN−2;1−α/2 ≤y0 − y0
SE(y0 − y0)≤ tN−2;1−α/2
)
= 1− α
126
Schritt 3: (II)
• Auflosen nach y0 ergibt:
P{
y0 − tN−2;1−α/2 · SE(y0 − y0) ≤ y0
≤ y0 + tN−2;1−α/2 · SE(y0 − y0)}
= 1− α
• Das gesuchte Prognoseintervall ist also
[y0 − tN−2;1−α/2 · SE(y0 − y0), y0 + tN−2;1−α/2 · SE(y0 − y0)]
127
Illustration: (Trinkgeldbeispiel)
• Fur x0 = 20 war die Punktprognose
y0 = 3.004845
• Geschatzte Prognosefehlervarianz war
ˆV ar(y0 − y0) = 1.402215
−→ Fur α = 0.05 ergibt sich das Prognoseintervall
[0.517061,5.492629]
128
Breite des Prognoseintervalls fur y0 in Abhangigkeit von x0
129
)( 002/1;20 yySEty N −⋅+∧
−−∧
αyi
00 xy∧∧∧
+= βα
)( 002/1;20 yySEty N −⋅−∧
−−∧
α
0x