Zeitreihenanalyse
M.Wagner
Einführung
Zeitreihe: (zeitabhängige) Folge von Datenpunkten Datenpunkte können 1- oder auch d- dimensional sein Typische Zeitreihen weisen regelmäßiges (Trend, Saison) &
zufälliges Verhalten auf
monatlichen Zeitreihe der Anzahl der tödlichen Verkehrsunfälle in Deutschland Anfang 1991Statistisches Bundesamt, Wiesbaden
Einführung
Zeitreihe: Zeitlich komplex
Komplexe Strukturen werden beschrieben durch
Frage:
Beispiel: Verkehr
dq
?),...)(()(
?....)(
tqftq
tqdt
d
Einführung
Zeitreihe: Räumlich komplex:
Komplexe Strukturen können durch lokale Unordnung beschrieben werden, z.B. durch skalenabhängige Größen
Inkrement q(l,x) Beispiel: Turbulenz, Finanzmarkt
Einführung
Fokker-Planck-Gleichung
D(1): Driftvektor; D(2): Diffusionsmatrix
Beschreibt die zeitliche Entwicklung der Übergangswahrscheinlichkeit
d
ii
i
txtxptxDx
txtxpt 1
)1( )','|,(),()','|,(
d
jiij
ji
txtxptxDxx1,
)2(2
)','|,(),(2
1
Zeitreihenanalyse
Billeter/Vlach
Einführung
Langevin Gleichung
D(1): Driftvektor; D(2): Diffusionsmatrix
Beschreibt die Entwicklung einer möglichen Trajektorie
)(),(),()( )2()1(ittxDtxDtx
dt
d
Brown‘sche Bewegung
Stochastische Prozesse
Aus der Langevin-Gleichung erhält man
mit X(t): Zustandsvektor des d-dimensionalen Phasenraums {x}
N: (nichtlineare) Funktion
Integration über kleine, aber endliche Zeitinkremente liefert
Problem: zwar klein, aber immer noch groß gegen Fluktuationen
Rauschentischdeterminis
)),(()),(()( ttXFttXNtXdt
d
t
t
t
ttttXgdtttXNdttXtX )'()'),'((')'),'((')()(
t
ttttXgdtttXNtX )'()'),'((')),(()(
Stochastische Prozesse
Mit dem Zentralen Grenzwertsatz folgt:
mit (t): gaußverteilte, statistisch unabhängige Zufallsvariable mit Mittelwert 0
Es bleibt also:
)(),( ttWd
),(:
satzMittelwert
)'(')),(()'()'),'(('
tWd
t
t
t
ttdtttXgtttXgdt
)()),(()),(()()( 1 iiiiiii tttXgttXNtXtX
Stochastische Prozesse
Markov-Prozesse Wichtige Klasse von stochastischen Prozessen Wahrscheinlichkeit d. zukünftigen Zustandes unabhängig von der
Vergangenheit des Systems Wahrscheinlichkeit hängt nur von der Gegenwart ab
Damit ergibt sich für die N-Punkt-Wahrscheinlichkeitsverteilung f:
Kenntnis der Übergangswahrscheinlichkeiten zusammen mit der Anfangswahrscheinlichkeitsverteilung reicht aus, um die N-Punkt-Wahrscheinlichkeitsverteilung zu bestimmen
),|,(),;...;,|,( 110011 iiiiiiii txtxptxtxtxp
),(),|,()...,|,(),;...;,( 0000111100 txftxtxptxtxptxtxf nnnnnn
Stochastische Prozesse
Bisher: Übergangswahrscheinlichkeit für infinitesimale Zeitdifferenzen ti - ti-1 =
Frage: Übergangswahrscheinlichkeiten p(x,t | x‘,t‘) für t – t‘ >>
Lösung: direkt aus der Fokker-Planck-Gleichung
d
ii
i
txtxptxDx
txtxpt 1
)1( )','|,(),()','|,(
d
jiij
ji
txtxptxDxx1,
)2(2
)','|,(),(2
1
Stochastische Prozesse
Es gilt:
Definition:
d
ljlilij
ii
txgtxgtxD
txNtxD
1
)2(
)1(
),(),(),(
),(),(
)')(')(,|,'('1
lim
))()()((1
lim),(
)')(,|,'('1
lim
)(1
lim),(
0
0
)2(
0
0
)1(
jjii
jjiiij
ii
iii
xxxxtxtxpxd
xtXxtXtxD
xxtxtxpxd
xtXtxD
Stochastische Zeitreihenanalyse
Ziel: das zugrundeliegende deterministische System in Form von DGL zu bestimmen In der Regel nicht möglich
Analyse von Zeitreihen von Stochastischen Systemen mit Markov-Eigenschaften wie folgt: Überprüfen der Markov-Eigenschaften Bestimmen der Übergangswahrscheinlichkeiten Rekonstruktion der Daten
Stochastische Zeitreihenanalyse
Markov-Eigenschaften überprüfen Im Allgemeinen schwer Für kleine Inkremente sind Markov-Eigenschaften oft verletzt
Rauschen korreliert Messrauschen zerstört Markov-Eigenschaften
Dennoch gibt es verschiedene Methoden Direkte Bestimmung
Überprüfen der Chapman-Kolmogorov Gleichung (notw. Bed.)
…
),|,(),;,(
),;,;,(),;,|,( 2233
1122
112233112233 txtxp
txtxf
txtxtxftxtxtxp
),|,)(,|,(),|,(~iijjjjkkjiikk txtxtxtxpdxtxtxp
Stochastische Zeitreihenanalyse
Bestimmen der bedingten Wahrscheinlichkeitsverteilung Driftvektor & Diffusionsmatrix sind 1. & 2. Moment der
bedingten Wahrscheinlichkeitsverteilung Diese lassen sich wie folgt direkt aus den experimentellen
Daten bestimmen: Daten im d-dimensionalen Phasenraum darstellen Phasenraum in kleine, aber endliche d-dimesionale Volumina um
x unterteilen Bestimme alle x(tj+1) - x(tj) für jede Partition
Stochastische Zeitreihenanalyse
Bestimmen der bedingten Wahrscheinlichkeitsverteilung Nun lassen sich Driftvektor und Diffusionsmatrix am Ort x
direkt bestimmen Wie wir wissen, gilt:
Entsprechend für D(2)
Ergebnis hängt entscheidend von der Größe der Partitionen ab Möglichst klein -> bessere Auflösung Die Daten sollten einen „Limes -> 0“ erlauben
)(
)1(
)1(
0
)1(
)]()([1
),,(
),,(1
lim),(
jtxjjj txtx
NtxM
txMtxD
Anwendungen Verkehrsfluss
Viel-Teilchen-Problem Theoretische Modelle basieren auf einem sog. fundamentalen
Schema, das besagt q = Q(v) Sehr viele Daten verfügbar Gemessen werden Geschwindigkeit v & Frequenz q = pv Messung an einer festen Stelle auf dem Highway Annahme: Dynamik wird beschrieben durch stochastische DGL
NNNN
NNNN
qvFq
qvGv
),(
),(
1
1
Anwendungen Verkehrsfluss
Deterministic dynamics of the twodimensional traffic states (q, v) given by the drift vector for (a) right lane of freeway with vans and (b) all three lanes.Bold dots indicate stable fixed points and open dots saddle points.Complexity in the View of Stochastic Processesauthors: R. Friedrich, J. Peinke and M. Reza Rahimi Tabar
Bei Berücksichtigung der Daten aller drei Spuren:
2 stabile Fixpunkt, 1 Sattelpunkt Die Daten sind ein Indiz für für die Existenz des
fundamentalen Schemas q = Q(v) Betrachtet man nun ausschließlich Vans
(rechte Seite des Highways): 1 Fixpunkt und: Ab ca. 80 km/h ist ein metastabiles Plateau
erreicht, welches eine quasi interaktionsfreie Dynamik beschreibt.
Anwendungen Verkehrsfluss
Deterministic dynamics of the twodimensional traffic states (q, v) given by the drift vector for (a) right lane of freeway with vans and (b) all three lanes.Bold dots indicate stable fixed points and open dots saddle points.Complexity in the View of Stochastic Processesauthors: R. Friedrich, J. Peinke and M. Reza Rahimi Tabar
Anwendungen Stromkreis mit Rauschen
Elektrischer Stromkreis mit chaotischem Verhalten Dynamik wird beschrieben durch einen gedämpften
Oszillator mit nichtlinearer Energiezufuhr und Rauschen
100 000 Datenpunkte wurden analysiert und dann mit den errechneten verglichen.
Die Dynamik wird beschrieben durch
),()(
),,(1)(
)(),()(1)(
)11
(
323323
3
32123232
212
121111
211
1111
XXgXXL
RX
XXXgXCRC
XXfX
thXXgtCRC
XXfX
CRCRX
NICNIC
Anwendungen Stromkreis mit Rauschen
Trajectory for the Shinriki oscillator in the phase space without noiseComplexity in the View of Stochastic Processesauthors: R. Friedrich, J. Peinke and M. Reza Rahimi Tabar
Xi: Spannungsterm
Daten wurden analysiert Die Dadurch bestimmte
deterministische Dynamik entspricht einem Vektorfeld im 3 Dimensionalen Phasenraum
Für die Darstellung wurden 2d- und 1d-Schnitte gewählt
Anwendungen Stromkreis mit Rauschen
Trajectory for the Shinriki oscillator in the phase space without noiseComplexity in the View of Stochastic Processesauthors: R. Friedrich, J. Peinke and M. Reza Rahimi Tabar
Cuts of the function D(1)(x) reconstructed from experimental data ofthe electric circuit in comparison with the expected functions according to the known differential (eqn. (75),(76)). In part a the cut g1(X1,X2), g2(X1,X2,X3 = 0) is shown as a two-dimensional vector field. Thick arrows represent values determined by data analysis, thin arrows represent the theoretically expected values. In areas of the state space where the trajectory did not show up during the measurement no estimated values for the functions are obtained. Figure b shows the one dimensional cut g1(X1,X2 = 0). Crosses represent values estimated numerically by data analysis. Additionally, the affiliated theoretically curve is printed as wellauthors: R. Friedrich, J. Peinke and M. Reza Rahimi Tabar
Anwendungen Skalen-Prozesse
Wahrscheinlichkeitsverteilung:
Oft multifraktales Verhalten
Haben die selbe Statistik Wird durch multifraktale Skalierung beschreiben
),;...;,( 00 lqlqf nn
),(),,( xlqxlq
Anwendungen Turbulenz
Betrachte Inkremente
Statistische Beschreibung durch:
Für stationäre, homogene und isotrope Turbulenz:
gkeitsfeldGeschwindi es turbulent:),(
)],(),([1
),(
txu
txutlxul
tlq x
),((),,,( tlqqxtlqf x
),(),,,( lqfxtlqf
Anwendungen Turbulenz
Von oben nach unten: l = L0, 0.6L0, 0.35L0, 0.2L0 and
0.1L0
Intermittenz Für große l gaußverteilt Bei kleinen l treten heftige
Ereignisse öfter auf Ähnliches Verhalten bei
Finanzmarktdaten
Complexity in the View of Stochastic Processesauthors: R. Friedrich, J. Peinke and M. Reza Rahimi Tabar
Anwendungen Finanzmarkt
Wechselkurs-Inkremente Dollar-DM 1992 & 1993
q(t,) =Y (t + ) − Y (t) Von unten nach oben
= 5120, 10240, 20480, 40960s
Bestimmung des zugrundeliegenden Prozesses ist ein ähnlich prominetes Rätsel, wie bei Turbulenz
Complexity in the View of Stochastic Processesauthors: R. Friedrich, J. Peinke and M. Reza Rahimi Tabar
Anwendungen Finanzmarkt
Berechnete Übergangswahrscheinlichkeiten stimmen gut mit den experimentellen Daten überein
Ab einer gewissen Schrittgröße können Turbulenz und Finanzmarkt-Dynamik als Markov-Prozess betrachtet werden
Drift und Diffusion sind Skalenabhängig und nichtstationär
Beschreibung von q(x,l) für festes l kein adäquates Mittel
Comparison of the numerical solution of the Fokker-Planck equationfor the conditional pdf p(q, l|q0, l0) denoted in this figure as p(v, r|v0, r0) with theexperimental data.Cuts through p(v, r|v0, r0) for v0 = +σ∞ and v0 = −σ∞ respectively.Open symbols: experimental data, solid lines: numerical solution of the Fokker-Planck equation
Quellen Importance of Fluctuations:
Complexity in the View of Stochastic Processes
R. Friedrich, J. Peinke, M. Reza Rahimi Tabar Zeitreihenanalyse
Kreiß, Neuhaus Zeitreihenanalyse
Billeter, Vlach
Ende