zeitreihenanalyse ws 2004/2005
DESCRIPTION
Zeitreihenanalyse WS 2004/2005. Michael Hauhs / Gunnar Lischeid. Definition einer Zeitreihe, Eigenschaften Tests und Trenderkennung bei Zeitreihen Beispiele (ACF, Tests), Fouriertransformationen , Powerspektrum Zeitreihenmodellierung der ARMA-Klasse - PowerPoint PPT PresentationTRANSCRIPT
ZeitreihenanalyseWS 2004/2005
• Definition einer Zeitreihe, Eigenschaften
• Tests und Trenderkennung bei Zeitreihen
• Beispiele (ACF, Tests), Fouriertransformationen, Powerspektrum
• Zeitreihenmodellierung der ARMA-Klasse
• Modellierung von Zeitreihen mit langem Gedächtnis
• Kausalität, Transferfunktionen, multivariate Methoden
• Skalierung, (Multi-)Fraktale
• Komplexität und Information von Zeitreihen
• Wavelets
Michael Hauhs / Gunnar Lischeid
Trendanalyse
Zugrundeliegendes Modell (additives Komponentenmodell):
)()()()())(),(()( ttTtTtStYtXftX SD )(tY externe Faktoren
)(tS saisonale Komponente
)(tTDdeterministischer Trend
)(tTSstochastischer Trend
)(t stationäres Rauschen
Globaler monotoner Trend: "im Mittel wächst X(t) an / fällt ab"
=> Trend des Mittelwerts (= 1. Moment der Verteilung)
Der Mann-Kendall Test
Anwendung des Kendall-Tests auf Zeitreihen (d.h., sortiert nach Zeit, ohne doppelte Einträge) => Trendtest:
01
00
01
)sgn(
x
x
x
x
1
1 1
))()(sgn(n
k
n
kjkj txtxS
Für die H0-Hypothese (= "es gibt keinen Trend") gilt dann:
18
)52()1()()var(
0)()(2
nnn
SS
SSE
=> normalverteilt
=> Ableitung der Testgröße: Abweichung der beobachteten (normierten) S von den laut H0 erwarteten
beachte: Korrektur für verbundene Ränge (Ranggleichheit) notwendig
=> statt
wobei tj = Anzahl der verbundenen Ränge (ties)
=> Teststatistik: ,
wobei D = maximal mögliche Anzahl der Konkordanzen:
Der Mann-Kendall Test
18
)52()1()()var( 2 nnn
SS
18
)52()1()52()1(
)()var( 12
p
jjjj tttnnn
SS
)1(2
1)1(
2
1)1((
2
1
1
nnttnnDp
jjj
D
S
Erweiterung auf saisonale Daten: saisonaler Mann-Kendall Test
n Beobachtungen pro Saisonteil (z.B. fester Tag im Jahr),m Saisonteile pro Saison (z.B. 365 Tage/Jahr)
igx i-te Beobachtung im g-ten Saisonteil
1
1 1
18/)52)(1(),sgn(n
i
n
ijgigjgg nnnxxS
m
g
m
ghg
hghggSg SSSS
1 1 ,
22 )cov(,
• Entmaskierung von Gesamttrends• Trends in einzelnen Saisonteilen (z.B. Monaten)
Regressionsanalyse zur Trendbeseitigung
k
iii tmtm
1
)()( )(tmi beliebig, aber bekannt (z.B. ii ttm )( )
Methode der kleinsten Quadrate:
n
t
tmtxQ1
2))()(( minimieren!
Normalgleichungen
n
tjiijij
n
tkkkkkk
n
tkk
n
tkk
tmtmcC
tmtxccc
tmtxccc
tmtxccc
1
12211
122222221
111212111
)()()(
)()(...
)()(...
)()(...
Fehler der Schätzwerte:
jjj C )()( 12
Desaisonalisierung
Vermutet wird eine (natürliche) Periode s in den Daten.
Unnormierte Desaisonalisierung:
mrmrm txtx )()(~,,
)( ,rmtx r-te Messung der m-ten Stelle ),...,1;,...,1( pmnr
Normierte Desaisonalisierung:
mmrmrm txtx /))(()(~,,
F
kkkm
F
kkkm
s
kmD
s
kmCC
s
kmB
s
kmAA
10
10
2sin
2cos
2sin
2cos
Additive Modelle zur Darstellung einer Zeitreihe
Zugrundeliegendes Modell (additives Komponentenmodell):
)()()()())(),(()( ttTtTtStYtXftX SD
Globaler monotoner Trend: „im Mittel wächst X(t) an / fällt ab“
Frequenzraumdarstellung von Zeitreihen
•bisher: Zeitreihen wurden durch ihre Werte dargestellt
(Zeitdomäne): x = x(t)
•alternativ: Darstellung in einem Funktionenraum - möglich für jede Funktion in einem n-dimensionalen Vektorraum:
1
)()(k
kk tcfxx
kc: Koeffizienten
: Basisfunktionenk
•sinnvolle Wahl des Funktionenraums:
additiv (Superposition) => orthogonale Funktionen
•Zwei Vektoren und heißen orthogonal wenn:
Orthogonalsysteme
332211
3
2
1
3
2
1
)cos(0 bababa
b
b
b
a
a
a
BABA
• vergleiche: Orthogonalität = "Unabhängigkeit", "Unkorreliertheit" im statistischen Sinne
=> Veränderung eines Vektor hat keine Auswirkungen auf den anderen Vektor: Superposition
B
A
ji
jidttt ji 0
0)()( * (kontinuierlicher Fall)
ji
jitt
kkjki 0
0)()( * (diskreter Fall)
Orthogonalsystem: sin(x), cos(x)
•Wahl von sin(x) und cos(x) als Basisfunktionen
2/...,,1,0:2cos,2sin Nk
Nkt
Nkt
bzw. Darstellung als komplexe Zahl:
21
2:
2 Nk
Ne N
kti
Wiederholung: Komplexe Zahlen
1ImRe 2 iezziziyxz i
1
sincos
i
i
e
ie
alternative Darstellung in Polarkoordinaten (φ, ρ):
22
)]sin()[cos(
yxyix
iyix
Eulersche Gleichung:
•generell:
• für f(x) = ex und a = 0 :
•analog für f(x) = eix :
• für a = 0 :
=>
Taylorreihendarstellung der trigonometrischen Funktionen
...!6!4!2
1)cos(642
xxxx
...!5!4!3!2
15432
ixxixx
ixe ix
xxan
axxfR
Rn
axaf
axaf
axafafxf
nn
n
n
nn
00)(
1)1(
2''
1'
!
)()(
)!1(
)()(...
!2
)()(
!1
)()()()(
...!5!4!3!2
15432
xxxxxe x
...!7!5!3
)sin(753
xxxxx
)sin()cos( xixe ix ...!7!5!3
)sin(753
ixixixixxi
=>
Exponent n 0 1 2 3 4 5 6 7 8
i n = 1 i -1 -i 1 i -1 -i 1
12 i
Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten
Länge der Messperiode
Anzahl der Perioden im Datensatz
Periodenlänge
Frequenz
Kreisfrequenz
harmonische Frequenz
Grundfrequenz, Frequenzauflösung
Nyquist-Theorem, Abtasttheorem
t
Frequenzen, Zeiten, Längen, Perioden, ...
tNT
TPkT
maxminmin 12
12 kkT
kk N
tPNkt
22/ minmaxmax
kk fkTP /2/1/
tN
k
Pf k
kk
2
1
kPTk /
kkk fP 2/2
tP
tNT
Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten
Länge der Messperiode
Anzahl der Perioden im Datensatz
Periodenlänge
Frequenz
Kreisfrequenz
harmonische Frequenz
Grundfrequenz, Frequenzauflösung
Nyquist-Theorem, Abtasttheorem
t
Frequenzen, Zeiten, Längen, Perioden, ...
tNT
TPkT
maxminmin 12
12 kkT
kk N
tPNkt
22/ minmaxmax
kk fkTP /2/1/
tN
k
Pf k
kk
2
1
kPTk /
kkk fP 2/2
Fourieranalyse = harmonische AnalyseJ.B.J. Fourier (1807): Jede stetige und periodische Funktion kann (beliebig genau) dargestellt werden als Superposition einer Serie harmonischer Schwingungen unterschiedlicher Frequenzen.
=> Entwicklung in eine unendliche trigonometrische Reihe:
Voraussetzungen (= Dirichletsche Bedingungen):
1. Die Funktion muss sich in endlich viele Teilintervalle zerlegen lassen können, in denen jeweils x stetig und monoton ist.
2. In den Unstetigkeitsstellen (Sprungstellen) existiert jeweils der links- und der rechtsseitige Grenzwert.
]2cos()2sin([2
)( 0
N
ktb
N
kta
atx k
kk
Fourierkoeffizienten
• hier: für periodische, diskrete, äquidistante Zeitreihen mit N Werten
• Schätzung der Koeffizienten für die kte harmonische Frequenz:
• Ausnahme für k = N/2:
N
iiik
N
iiik
tNk
xN
b
tNk
xN
a
1
1
)2cos(2
)2sin(2
N
iiN
N
tNxN
b
a
12/
2/
))2/(2cos(2
21
0
Fouriertransformation
deftx ti
21
)(
Für unendlich lange Zeitreihen gibt es alle Frequenzen
Merkmale:• umkehrbar• existiert für absolut integrierbare Funktionen• zeitglobal• Stationarität prinzipiell erforderlich
k
tik etxf
21
)( Spektrum von tx
Beispiel für eine Fourierapproximation
1 Term: Mittelwert
2 Terme
3 Terme
5 Terme
10 Terme
100 Terme
Aliasing
= "Frequenzmissdeutung"
= "Einstrahlen" höherer Frequenzen in den niedrigen Bereich aufgrund der endlichen Länge/Auflösung des Datensatzes:
Parsevalsches Theorem
Die totale Varianz der Werte ist gleich der Summe der Varianzen der einzelnen Frequenzen:
Energie ist im Zeit- und Frequenzraum gleich
Def.: Energie eines Signals:
)()()( 221
2
2221
21
2kk
k
iiiT bababa
k
ktxE2
)(
Periodogramm
• Aufteilung der Varianz auf die einzelnen Frequenzen:
s2(k) (= spektrale Varianz) gegen k aufgetragen
• Berechnung anhand der Fourier-Koeffizienten:
2
)( 22 NbaI kkk
Periodogramm
= Darstellung der Varianzanteile für die einzelnen Frequenzen bzw. Phasenlängen
0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
Frequenz
0
5
10
15
20
25
Periodogram
m-Werte
0
5
10
15
20
25
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32
Per iode
0
5
10
15
20
25
Periodogram
m-Werte
0
5
10
15
20
25
Aufgabe
1. Berechnen Sie in Excel die Fourierkoeffizienten für den Datensatz in Aufgabe_Fourieranalyse.xls.
2. Erstellen Sie anhand der Fourierkoeffizienten ein Periodogramm.
3. Rekonstruieren Sie die Zeitreihe als Superposition der entsprechenden sin- und cos- Funktionen.
4. Führen Sie mit den Daten eine Fourieranalyse in Statistica durch und vergleichen Sie die Ergebnisse.