modellreduktion und optimale regelung nichtlinearer...

156
Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse Model Reduction and Optimal Control of Nonlinear Flow Processes Von der Fakultät für Maschinenwesen der Rheinisch-Westfälischen Technischen Hochschule Aachen zur Erlangung des akademischen Grades eines Doktors der Ingenieurwissenschaften genehmigte Dissertation vorgelegt von Lorenz Pyta Berichter: Univ.-Prof. Dr.-Ing. Dirk Abel Prof. Dr.-Ing. Dr. h.c. Oliver Sawodny Tag der mündlichen Prüfung: 21. Februar 2018 Diese Dissertation ist auf den Internetseiten der Universitätsbibliothek online verfügbar.

Upload: buidien

Post on 11-Aug-2019

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Modellreduktion und optimale Regelung nichtlinearerStrömungsprozesse

Model Reduction and Optimal Control of NonlinearFlow Processes

Von der Fakultät für Maschinenwesen der Rheinisch-Westfälischen Technischen HochschuleAachen zur Erlangung des akademischen Grades eines Doktors der Ingenieurwissenschaften

genehmigte Dissertation

vorgelegt von

Lorenz Pyta

Berichter: Univ.-Prof. Dr.-Ing. Dirk AbelProf. Dr.-Ing. Dr. h.c. Oliver Sawodny

Tag der mündlichen Prüfung: 21. Februar 2018

Diese Dissertation ist auf den Internetseiten der Universitätsbibliothek online verfügbar.

Page 2: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse
Page 3: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Kurzzusammenfassung

Die dynamische Beschreibung von Strömungsprozesse ist üblicherweise die nichtlineare par-tielle Differentialgleichung (PDE). Für die Beherrschung technischer Strömungen ist es not-wendig, diese Prozesse dynamisch zu regeln. Im Fall einer modellbasierten Regelung sind dieetablierten Ansätze, entweder die PDE über Modellreduktion zu reduzieren und den Reglerauf Basis des reduzierten Modells zu entwerfen, oder direkt einen PDE-Regler zu bestimmenund diesen dann zu reduzieren. Hier treten vor allem zwei Probleme auf: Zum einen sind dieMethoden der Modellreduktion nicht auf nichtlineare PDEs angepasst. Zum anderen werdenin beiden Vorgehensweise die Schritte der Modellreduktion und des Reglerentwurfs vonein-ander separiert betrachtet. In dieser Arbeit werden daher neue Modellreduktionsmethodenvorgestellt, die - ohne die allgemeinere Verwendbarkeit zu beeinträchtigen - für Strömungs-prozesse maßgeschneidert sind, und ein neues Regelungsverfahren präsentiert, welches einenoptimalen Regler entwirft, der den Reglerentwurf auf PDE-Basis mit der Modellreduktion ineinem einheitlichen Konzept zusammenführt.

Abstract

The dynamics of flow processes are typically described with nonlinear partial differential equa-tions (PDEs). For an optimal operation of such processes model based control is necessary.The common approaches for model based control of PDEs are nowadays to either reduce thePDE-model by smart discretization and to design the controller based on the reduced ordermodel or to use the PDE-model for a PDE controller design and discretize the controllerafterwards. Problems arise here, as the model reduction technqiues are not customized fornonlinear flow processes. Furthermore, the steps of model reduction and controller designare seperated from eath other. This work present new techniques for model order reduction,which are general but customized for nonlinear flows, and a framework of optimal controllerdesign including both model reduction and controller design based on PDEs.

iii

Page 4: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse
Page 5: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Inhaltsverzeichnis

Abbildungsverzeichnis vii

Formelzeichen ix

1 Einleitung 11.1 Einführung und Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Stand der Technik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.3 Zielsetzung und Gliederung der Arbeit . . . . . . . . . . . . . . . . . . . . . 7

2 Grundlagen der Strömungsprozesse 112.1 Modellierung von Strömungen . . . . . . . . . . . . . . . . . . . . . . . . . 112.2 Zur Lösung partieller Differentialgleichungen . . . . . . . . . . . . . . . . . 14

2.2.1 Regularität von Lösungen . . . . . . . . . . . . . . . . . . . . . . . 142.2.2 Funktionenräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.3 Distributionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3 Grundlagen der Modellreduktion 213.1 Galerkin-Projektion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.1.1 Der Weg zur gewöhnlichen Differentialgleichung . . . . . . . . . . . 213.1.2 Inhomogene Randbedingungen . . . . . . . . . . . . . . . . . . . . . 233.1.3 Approximationsfehler und Genauigkeit . . . . . . . . . . . . . . . . . 25

3.2 Proper Orthogonal Decomposition . . . . . . . . . . . . . . . . . . . . . . . 263.2.1 Optimale Basisfunktionen . . . . . . . . . . . . . . . . . . . . . . . 273.2.2 Optimale Koeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . 303.2.3 Diskretisierte Implementierung . . . . . . . . . . . . . . . . . . . . . 313.2.4 Mehrdimensionalität . . . . . . . . . . . . . . . . . . . . . . . . . . 343.2.5 Auswahl der Moden . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4 Angepasste Methoden der Modellreduktion 394.1 Nichtlineare Modellreduktion . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.1.1 Generelle Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . 404.1.2 Nichtlineare Dimensionsreduktion . . . . . . . . . . . . . . . . . . . 454.1.3 Reduktion mittels iterativer Verfahren . . . . . . . . . . . . . . . . . 464.1.4 Reduktion mittels Künstlicher Neuronaler Netze . . . . . . . . . . . 504.1.5 Reduktion mittels graphenbasierter Verfahren . . . . . . . . . . . . . 55

4.2 Interpolation reduzierter Modelle . . . . . . . . . . . . . . . . . . . . . . . 604.2.1 Struktur der Modellinterpolation . . . . . . . . . . . . . . . . . . . 61

v

Page 6: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Inhaltsverzeichnis

4.2.2 Interpolation über Mannigfaltigkeiten . . . . . . . . . . . . . . . . . 634.2.3 Interpolation durch Ausrichten . . . . . . . . . . . . . . . . . . . . . 68

4.3 Adaptive Modellreduktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 704.3.1 Closure Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 724.3.2 Modelladaption durch Kalmanfilter . . . . . . . . . . . . . . . . . . 73

5 Grundlagen der optimalen Regelung 775.1 Klassische Optimierungsprobleme . . . . . . . . . . . . . . . . . . . . . . . 775.2 Optimale Steuerung und Regelung . . . . . . . . . . . . . . . . . . . . . . . 795.3 Optimalsteuerungsprobleme für PDEs . . . . . . . . . . . . . . . . . . . . . 82

6 Angepasste Methoden der optimalen Regelung 856.1 Modellreduktion der optimalen Steuerung . . . . . . . . . . . . . . . . . . . 866.2 Bestrafen von Stellgrößenänderung und Regelfehler . . . . . . . . . . . . . . 876.3 Resultierende Gesamtstruktur . . . . . . . . . . . . . . . . . . . . . . . . . 90

7 Anwendungsbeispiele 937.1 Mathematische 2D-Strömungsmodelle . . . . . . . . . . . . . . . . . . . . . 93

7.1.1 Einfache Nischenströmung . . . . . . . . . . . . . . . . . . . . . . . 937.1.2 Doppelte Nischenströmung . . . . . . . . . . . . . . . . . . . . . . 1017.1.3 Einfache überströmte Oberfläche . . . . . . . . . . . . . . . . . . . 112

7.2 Widerstandsreduktion an einer überströmten Platte . . . . . . . . . . . . . . 1177.3 Wärmekonvektion in einem Festbettspeicher . . . . . . . . . . . . . . . . . 123

7.3.1 Regelungsaufgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . 1237.3.2 Beschreibung über partielle Differentialgleichungen . . . . . . . . . . 1257.3.3 Modellreduktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1287.3.4 Ergebnisse der Regelung . . . . . . . . . . . . . . . . . . . . . . . . 132

8 Zusammenfassung und Ausblick 135

Literaturverzeichnis 137

vi

Page 7: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Abbildungsverzeichnis

4.1 Beispielhaftes Künstliches Neuronales Netz . . . . . . . . . . . . . . . . . . 514.2 Strukturbild eines Autoencoders . . . . . . . . . . . . . . . . . . . . . . . . 524.3 Euklidische Abstände und geodätische Abstände auf einer Mannigfaltigkeit . 554.4 Approximation des geodätischen Abstands und geodätische Konvexität . . . 564.5 Erste POD-Basisfunktion der Burgersgleichung für verschiedene Viskositäten 614.6 Elementweise Summe von zwei Basisfunktionen mit Dimensionsverlust . . . . 624.7 Interpolation auf Mannigfaltigkeiten am Beispiel der Sphäre . . . . . . . . . 644.8 Bézier-Kurven vom Grad 2 und 3 im R2 inklusive Kontrollpunkte . . . . . . 664.9 Schematische Skizze zweier Unterräume und ihrer Projektionen aufeinander . 69

7.1 Darstellung einer Nischenströmung in 2D . . . . . . . . . . . . . . . . . . . 947.2 Projektionsfehler auf die Validierungsdaten für verschiedene N und Methoden 1017.3 Darstellung einer doppelten Nischenströmung mit Stör-, Stell- und Regelgröße 1027.4 Struturbild des Reglers C mit integrierte Modellinterpolation . . . . . . . . . 1047.5 Führungsverhalten von Regler A, B und C bei veränderlicher Reynoldszahl . . 1057.6 Führungsverhalten von Regler A, B und C: Zoom . . . . . . . . . . . . . . . 1057.7 Störgrößenunterdrückung von Regler A, B und C für Re = 225 . . . . . . . 1067.8 Relativer Informationsgehalt RIC der POD . . . . . . . . . . . . . . . . . . 1097.9 Projizierte und simulierte Koeffizienten für die ersten vier Basisfunktionen von

a und b. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1107.10 Performanz des Reglers und Vergleich mit statischer Vorsteuerung. . . . . . 1107.11 Vergleich der über die PDE und der über das reduzierte Modell ermittelten

Stellgrößen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1117.12 Längsschnitt durch eine durch Oberflächenwellen veränderte Platte und ver-

einfachtes Ersatzsystem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1127.13 Projizierte und geschätzte Zustände des reduzierten Modells mit und ohne

Adaption . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1147.14 Verläufe der geschätzten fiktiven Viskosität µe und des Rempfer-Parameters p 1147.15 Skizze des Rechengebietes der turbulenten Grenzschicht der aktuierten Platte 1187.16 Form des Übergangs hin zur aktuierten Platte und Form der Oberflächenwelle 1197.17 Relativer Informationsgehalt der turbulenten Grenzschicht . . . . . . . . . . 1207.18 Vergleich des Widerstandes der CFD-Simulation mit den projizierten Koeffizi-

enten der POD mit N = 30 Basisfunktionen . . . . . . . . . . . . . . . . . 1217.19 Vergleich des Widerstandes der CFD-Simulation mit den projizierten und si-

mulierten Koeffizienten der Laplacian Eigenmaps mit N = 20 Basisfunktionen 1237.20 Schema des Solarturms Jülich . . . . . . . . . . . . . . . . . . . . . . . . . 1247.21 Schematischer Aufbau des Festbettspeichers mit seinen vier Kammern . . . . 125

vii

Page 8: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Abbildungsverzeichnis

7.22 Durchschnittlicher Strompreis an der Leipziger Strombörse von 2011-2015 . . 1267.23 Gewünschtes Temperaturprofil des Wärmespeichers . . . . . . . . . . . . . . 1307.24 Simulierte und projizierte Verläufe des reduzierten Modells . . . . . . . . . . 1317.25 Verlauf der Speichertemperatur im reduzierten Modell und den Messdaten . . 1327.26 Verlauf von θ im geschlossenen Regelkreis . . . . . . . . . . . . . . . . . . . 1347.27 Abweichung θ − r im geschlossenen Regelkreis . . . . . . . . . . . . . . . . 134

viii

Page 9: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Formelzeichen

Lateinische Kleinbuchstabena Zeitabhängiger Koeffizient der Ansatzfunktionenb Zeitabhängiger Koeffizient der Ansatzfunktionenc Funktion der Nebenbedingungend Dimension

Metrike Fehlermaßej j-ter Einheitsvektorf Funktionfa Vektor der spezifischen äußeren Kräfteg Eingangsterm der Galerkin-Modellei Laufindexj Laufindexk Laufindexl Längem Massen Dimensionn Normalenvektoro(|h‖) Landau-Symbolp Druck

Exponent der Rempfer-Modelle für die fiktiven Viskositätenq Quadratischer Term der Galerkin-Modeller Referenz und Sollwert der Regelgrößerj Snapshot im reduzierten Raumt Zeitu Stellgrößev Lösungsfunktion einer PDE

Fließgeschwindigkeit einer Strömungvj Snapshotvj dualer Snapshotw (fiktive) Stellgrößex Ortskoordinatey Regelgröße und Messwert einer Regelstreckez Störgröße

ix

Page 10: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Formelzeichen

Lateinische GroßbuchstabenA Oberfläche

AmplitudeA Zeitdiskretisierter Koeffizientenvektor der AnsatzfunktionA Systemmatrix des Zustandsraums

Matrix der zeitdiskretisierten Koeffizienten der AnsatzfunktionenB Eingangsmatrix des ZustandsraumsC Ausgangsmatrix des ZustandsraumsF KraftG Isomap-KernI EinheitsmatrixJ (Güte-)Funktion(al)K KonstanteK Korrekturmatrix des KalmanfiltersL Linearer Term der Galerkin-ModelleM MatrixMa MachzahlN (Geringe) Anzahl an BasisfunktionenP PunktP Kovarianzmatrix des KalmanfiltersQ Wichtungsmatrix der Zustandsgrößen ξ

Matrix der QR-ZerlegungWichtungsmatrix für das Modellrauschen des Kalmanfilters

QS Summe aller Quellen und SenkenR Wichtungsmatrix der Stellgrößen u

Matrix der QR-ZerlegungWichtungsmatrix für das Messrauschen des Kalmanfilters

Re ReynoldszahlT Zeitintervall

Temperatur der LuftT TransformationsmatrixV Datenmatrix für die ModellreduktionW Gewichte der Künstlichen Neuronalen Netze

Wichtungsmatrix eines GraphenX Normierter Funktionenraum

Griechische Kleinbuchstabenα Multiindex

Zustand des joint Kalmanfilterβ Bézier-Kurveγ Geodäteδ Dirac-Impuls

Initialisierungsparameter des AutoencodersEinstellparameter der Laplacian Eigenmaps

η Skalare Eigenschaft eines Strömungsteilchen oder eines Kontrollvolumens

x

Page 11: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

ϑ Impulsverlustdickeθ Temperatur des Speichermediumsκ Lagrange-Multiplikatorλ Eigenwert

Lagrange-MultiplikatorWellenlänge

µ Kinematische Viskositätξ Zustandsgrößeρ Dichteτ Laufvariableϕ Ortsabhängige Basisfunktion/Mode

Testfunktionψ Ortsabhängige Basisfunktionω Frequenz

Griechische GroßbuchstabenΓ Rand von Ω mit Einfluss der StellgrößeΓ Matrixrepräsentation der Geodäte∆ Vektorwertiger Laplace-OperatorΛ Diagonal-Matrix der Eigenwerte λΣ Matrix der SingulärwerteΦ Ortsdiskretisierter BasisfunktionsvektorΦ Ortsdiskretisierte BasisΩ Offene, beschränkte und nichtleere Menge mit stückweise glattem C1-Rand

Kontrollvolumen

Kalligraphische BuchstabenC AusgangsoperatorF Operator einer PDEG Formal adjungierter Operator einer PDE

Graßmann-MannigfaltigkeitL LagrangefunktionM MannigfaltigkeitN (Hohe) Anzahl an BasisfunktionenR POD-OperatorR Adjungierter POD-OperatorT TangentialraumUϕ Von der Basis ϕ aufgespannter Unterraum

Weitere mathematische Notationenf Zeitliche Ableitung von f∇ Nabla-Operator∂Ω Rand des Gebietes Ω∂nf∂xn

n-te partielle Ableitung von f nach x

xi

Page 12: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Formelzeichen

dfdx

Totale Ableitung von f nach xDf Jacobische von f〈·, ·〉X Skalarprodukt im Raum X

Abkürzungen und Akronyme

BPOD Balanced PODCFD Computational Fluid DynamicsCVT Centroidal Voronoi TesselationDEIM Discrete Empirical Interpolation MethodDMD Dynamic Mode DecompositionDNS Direkte Numerische SimulationERA Eigensystem Realization AlgorithmKKT Karush-Kuhn-TuckerKNN Künstliches Neuronales NetzLES Large Eddy SimulationLQR Linear-Quadratischer ReglerMPR Modellprädiktive RegelungODE Gewöhnliche DifferentialgleichungPCA Principal Component AnalysisPDE Partielle DifferentialgleichungPOD Proper Orthogonal DecompositionRIC Relative Information Content

Hinweise zur mathematischen Notation

Skalare Größen a werden durch Variablen in normaler Schrift dargestellt, Vektoren a werdenfettgedruckt und Matrizen und Tensoren a zusätzlich mit einem Unterstrich versehen. Dieeinzelne Elemente von Matrizen oder Vektoren werden durch Indizierung des Symbols inNormalschrift dargestellt. Somit bezeichnet aij bezeichnet das Element der i-ten Zeile undj-ten Spalte der Matrix a. Elemente einer Menge werden durch Hochstellung gekennzeichnet,weshalb a(k) das k-te Element aus der Menge a bezeichnet.

Zur verbesserten Lesbarkeit werden Funktionsargumente weggelassen, sofern diese bereitsvorher verwendet wurden und sich nicht geändert haben.

xii

Page 13: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

1 Einleitung

1.1 Einführung und Motivation

Am 19. Mai 2015 gegen 11:30 amerikanischer Zeit entdeckten man in der texanischen Leitwar-te von ’Plains All American Pipeline’ einen ungewöhnlichen Druckabfall in der kalifornischenHochdruck-Ölpipeline ’Line 901’. Die Pipeline wurde daraufhin geschlossen. Das Leck in derPipeline konnte allerdings erst gegen 13:30 gefunden werden und es brauchte drei weitereStunden, es zu schließen. In der Zwischenzeit flossen etwa 400.000 Liter Erdöl aus der Pipe-line, welches über einen Kanal größtenteils in den Ozean geriet und damit für eine schwereÖlpest sorgte.

Die Selbstverständlichkeit, mit der wir Grundkonstellationen dieses auch unter dem NamenRefugio-Ölunfall bekannten Ereignisses teilweise hinnehmen, zeigt: Strömungs- und Trans-portprozesse sind ein nicht wegzudenkender Bestandteil unserer heutigen industrialisiertenGesellschaft. Ohne den schnellen Transport von Rohstoffen von A nach B würde viele deretablierten Abläufe in Industrie und Wirtschaft nicht so funktionieren, wie sie es heute tun.Das gilt aber nicht nur für den Transport von Stoffen und Materialien wie Öl, sondern auchfür den Transport von Personen und Informationen, die heutzutage ebenso schnell über größ-te Distanzen befördert werden. Dadurch nimmt man es heutzutage oft wie selbstverständlichhin, dass im Internet bestellte Waren innerhalb weniger Tage an die eigene Haustür geliefertwerden und man im Urlaub in weit entfernte Ländern reist.

Der Refugio-Ölunfall zeigt aber auch: Strömungsprozesse sind sehr wichtig, aber sie sindebenso schwierig zu kontrollieren. Das zeigt unter anderem die Tatsache, dass fast zwei Stun-den benötigt wurden, um das Leck zu entdecken. Es war den Betreibern zwar möglich, durchden Druckabfall in der Leitung zu erkennen, das ein Leck vorlag, aber nicht, wo sich diesesbefand. Da die Druckmessungen nicht über die gesamte Länge der Pipeline sondern nur anEin- und Auslass vorlagen, war der Schluss, wo das Leck aufgetreten war ohne Informationen,wie sich die Position des Lecks denn auf den Druck an Ein- und Auslass auswirken würde,nicht möglich. Verallgemeinert für Strömungen kann man festhalten: Dadurch dass Strömun-gen örtlich verteilt sind, benötigt man Modelle, um aufgrund von Informationen am Randvalide Rückschlüsse auf das Verhalten im Innern ziehen zu können. Im Idealfall wäre es sogarmöglich gewesen, den Druck in der Pipeline proaktiv zu senken, um einen Bruch der Pipelinezu verhindern, oder zumindest eine automatische Abschaltung der Pipeline vorzunehmen.

1

Page 14: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

1 Einleitung

Derartige Fragestellung werden unter anderem von der technischen Forschungsrichtung derRegelungstechnik adressiert, welche sich damit befasst, wie dafür gesorgt werden kann, dassein betrachtetes System gewünschte Eigenschaften aufweist. Dies bedeutet in der Regel, dassein Algorithmus entworfen wird, der auf das System wirkende Eingangsgrößen (wie beispiels-weise den Druck, mit welchem Öl in eine Pipeline gepumpt wird) dergestalt berechnet, dassdefinierte Ausgangsgrößen (wie die Belastung der Pipelinewand) des Systems die gewünschtenWerte annehmen. Die Anwendbarkeit besonders leistungsfähiger Regelungskonzepte ist dabeivom Vorhandensein mathematischer Modelle, die das Verhalten zwischen den Ein- und Aus-gangsgrößen des Systems beschreiben, abhängig. Hierbei entsteht ein inhärenter Zielkonfliktzwischen der Genauigkeit und der Komplexität des Modells. Während akkuratere Modelle dieQualität der Regelung verbessern können, steigt mit der Genauigkeit des Modells in der Regelauch dessen Komplexität und damit die von den Algorithmen benötigte Zeit zur Berechnungder korrekten Eingangsgröße. Dadurch kann die Verwendung komplexer Modelle die Echtzeit-fähigkeit des Reglers verhindern und die Umsetzung in der Praxis unmöglich machen.

Strömungsprozesse werden mathematisch durch partielle Differentialgleichungen (PDEs) be-schrieben. Diese können anschaulich als ein System gewöhnlicher Differentialgleichungen(ODEs) mit unendlich vielen Zuständen interpretiert werden, wobei die unendliche Zahl derZustände davon herrührt, dass die Größen, welche das System physikalisch beschreiben (wieetwa ein Druck) an jeder möglichen Ortskoordinate (das heißt zum Beispiel: über die gesamteLänge der Pipeline) bekannt sein müssen. Durch die unendliche Anzahl an Zuständen habendiese Modelle oft eine enorme Komplexität und können nur schwer für den direkten Entwurfeines Reglers verwendet werden. Ein möglicher Ansatz zur Regelung von Strömungsprozessenist es daher, die partiellen Differentialgleichungen durch reduzierte Modelle zu approximie-ren, die weniger Zustände und dennoch eine vergleichbare Beschreibungskraft besitzen. Vieleetablierte Methoden der Modellreduktion sind dabei auf den speziellen Anwendungsfall derRegelung von Strömungsprozessen nicht angepasst. Die vorliegende Arbeit möchte dahereinen Beitrag dazu leisten für Strömungsprozesse angepasste Methoden der Modellreduktionbereitzustellen. Zusätzlich werden die Regler, die auf den reduzierten Modelle aufsetzen, oft-mals ausgelegt, ohne dass berücksichtigt wird, dass es sich bei den Modellen um reduzierteModelle einer PDE handelt. Das heißt, dass die aufeinander aufbauenden Schritte der Modell-reduktion und des Reglerentwurfs separat durchgeführten werden. Daher ist es das zweite Zieldieser Arbeit, die beiden Vorgänge der Modellreduktion und des Reglerentwurfs methodischganzheitlich zu betrachten, indem die beiden Schritte dadurch enger miteinander verzahntwerden, als dass die Modellreduktion für den auf PDE-Basis entworfenen Regler durchgeführtwird.

1.2 Stand der Technik

Da Strömungsprozesse durch partielle Differentialgleichungen modelliert werden, wie auchspäter im Kapitel 2.1 dargelegt werden wird, bildet die Strömungsregelung einen Sonderfallder Regelung von Systemen, die durch partiellen Differentialgleichungen beschrieben werden.Die Regelung solcher Systeme lässt sich nach der Art des zugrunde liegenden Modells in

2

Page 15: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

1.2 Stand der Technik

drei Kategorien einteilen. So kann entweder gar kein Modell, eine PDE als Modell oder einreduziertes Modell verwendet werden.

Bei den Regelungsverfahren, die kein Modell für den Reglerentwurf verwenden, sind an ers-ter Stelle Extremum-Seeking Regler [4] zu nennen, die beispielsweise in [50] zu Regelungdes Strömungswiderstandes im Kontext eines Strömungsabriss erfolgreich umgesetzt wurden.Neben den Extremum-Seeking Reglern als optimierungsbasierten Verfahren spielen auch ler-nende Verfahren eine zunehmende Rolle [17]. So werden Methoden des maschinellen Lernens– wie genetische Algorithmen oder Künstliche Neuronale Netze (KNNs)– zur Regelung vonStrömungsprozessen eingesetzt [33]. Die modellfreien Verfahren haben den Vorteil, nur gerin-ge Vorkenntnisse des zu regelnden Prozesses zu erfordern. Daher ist die in den modellfreienVerfahren eingesetzte Methodik auf eine große Klasse von Problemen anwendbar. In praxis-nahen Studien, wie beispielsweise in den Arbeiten [22] und [90], konnte die Anwendbarkeitdieser Verfahren demonstriert werden. Allerdings muss, da die Dynamik des Systems demRegler unbekannt bleibt, stets gewartet werden, bis dynamischen Effekte abgeklungen sindund ein quasi-stationärer Zustand erreicht wurde, weil ansonsten der durch den Regler erfolg-te Stelleingriff nicht adäquat bewertet werden kann. Deswegen erreichen regelungstechnischeMethoden, die die dynamischen Eigenschaften des zu regelnden Systems über ein Modellmitberücksichtigen, in der Regel ein besseres dynamisches Verhalten des geschlossenen Re-gelkreises.

Arbeitet der Regler nicht modellfrei, sondern verwendet ein Modell des zu regelnden Prozesses,so ist es für Strömungsprozesse möglich, partiellen Differentialgleichungen als Modell zu nut-zen und somit den Regler auf Basis von PDEs zu entwerfen. Hier können drei teilweise mitein-ander verwandte Methoden unterschieden werden [73]. Erstens nutzen die flachheitsbasiertenVerfahren [70] die Verallgemeinerung der Konzepte des flachheitsbasierten Reglerentwurfs fürpartielle Differentialgleichungen. Hierdurch konnten insbesondere bei der Vorsteuerung undder Trajektorienplanung gute Ergebnisse erzielt werden [72]. Die regelungstechnische Theoriedeckt hier bisher allerdings vor allem lineare PDEs ab. Trotz Erweiterungen auf nichtlinea-re PDEs gelten diese nur für spezielle nichtlineare Funktionsklassen wie semilineare PDEs[104]. Die klassischen Gleichungen für Strömungen fallen nicht in diese Funktionsklassen.Deswegen werden oftmals linearisierte Strömungen um Gleichgewichtspunkte betrachtet –wie beispielsweise in [49] oder [11], deren Aussagekraft über den vollständigen Arbeitsbereichaber natürlich eingeschränkt sind. Zweitens ist die zur Zeit vermutlich populärste Regler-entwurfsmethode für PDEs das Backstepping-Verfahren [62]. Bei dieser Methode basiert derReglerentwurf darauf, geeignete (Volterra-)Integraltransformationen zu finden, welche die Re-gelstrecke auf eine Wunsch-PDE abbilden. Für die Wunsch-PDE, deren Wahl durch die Struk-tur der zu regelnden PDE eingeschränkt ist, wird oftmals eine einfache Transportgleichungherangezogen, wodurch bewiesen werden kann, dass der geschlossenen Regelkreises stabil istund in endlicher Zeit gegen den Sollwert konvergiert. Aus den Transformationen kann mandas zu verwendende Regelgesetz ableiten, sofern die Invertierbarkeit der Integraloperatorender Transformation gewährleistet ist. Auf analoge Weise lassen sich ebenso Beobachter überdas Backstepping-Verfahren entwerfen [111]. Auch dieses Verfahren wird primär bei linea-ren PDEs angewandt und die Anwendbarkeit auf nichtlineare PDEs bleibt bisher auf wenige

3

Page 16: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

1 Einleitung

Sonderfälle beschränkt [119],[120], in denen sich die Nichtlinearität als Volterra-Reihe dar-stellen lässt. Eine Erweiterung auf Strömungsprozesse charakterisierende nichtlinear PDEssteht noch aus [121], weshalb die zu Strömungen gehörigen PDEs für die Anwendung desBackstepping-Verfahrens stets linearisiert werden müssen [118]. Als drittes Verfahren ist derEntwurf stabilisierender Regler auf Basis der Verallgemeinerung der Stabilitätstheorie nachLyapunov für PDEs zu nennen. Die Stabilitätstheorie basiert dabei auf den Konzepten der in-finitesimalen Generatoren von Halbgruppen [28] und dem LaSalle’schen Invarianzprinzip [46].Hierdurch kann die asymptotische Stabilität des geschlossenen Regelkreises nachgewiesenwerden. Diese Konzepte fußen allerdings auf der Annahme eines linearen Differentialoperatorsder PDE, wodurch die Anwendbarkeit auf nichtlineare PDEs stark limitiert ist. Der Reglerent-wurf erfolgt direkt aus dem Lyapunovfunktional [103] und auch der Entwurf eines Beobachterist möglich. Aufgrund der starken Problemabhängigkeit der Kandidaten für die Lyapunovfunk-tionale ist das Vorgehen nicht ohne weiteres von einem System auf das andere übertragbar.

Die Analyse der Regelungsverfahren mit PDEs als Modell für nichtlineare Strömungsprozes-se bietet insgesamt ein teilweise ernüchterndes Bild. Zwar gibt es zahlreiche Verfahren, mitdenen in vielen Bereich exzellente Resultate erreicht wurden. Allerdings beinhaltet die Klasseder PDEs, die mit diesen Verfahren behandelt werden können, nicht allgemeinere nichtlinearePDEs zu denen die PDEs für Strömungsprozesse zählen. Beispielsweise lassen sie sich nicht aufdie für die Anwendung sehr relevanten Navier-Stokes-Gleichungen als bilinearer PDE anwen-den, weshalb hier stets auf Linearisierungen oder ähnliche Vereinfachungen zurückgegriffenwerden muss.

Neben der Theorie bezüglich des Reglerentwurfs auf Basis von partiellen Differentialglei-chung gibt es jedoch auch eine umfangreiche Theorie zur Steuerung und optimalen Steuerungpartiellen Differentialgleichungen. Analog zum Falle der Regelung sind die mathematischenKonzepte der optimalen Steuerung von PDEs für lineare Gleichungen sehr gut ausgebaut[116]. Zusätzlich gibt es jedoch auch umfangreiche Arbeiten und Ansätze für nichtlinearenPDEs [52]. Die Verfahren der optimalen Steuerung lassen sich dabei in sensitivitätsbasierteund adjungierte Verfahren unterteilen [68]. Bei der Optimierung auf Basis der Sensitivitätwerden die Sensitivitäten der Regelziele bezüglich der Stellgrößen berechnet und zur Opti-mierung verwendet. Die auf den adjungierten Gleichungen aufbauenden Verfahren verwendenstattdessen adjungierte Operatoren, die zu der Methode der Lagrange-Multiplikatoren äqui-valent sind [52]. Gerade die adjungierten Verfahren werden im Falle von Strömungsprozessenregelmäßig angewandt [43], [44]. Auf diese Weise wurden für die zweidimensionalen inkom-pressiblen Navier-Stokes-Gleichungen mehrfach optimale Steuerungen entworfen [39], [51]oder Optimierungen durchgeführt [117]. Die optimale Steuerung von PDEs oder die Optimie-rung unter PDE-Nebenbedingungen werden dabei stets offline berechnet und finden vor allembei der Formoptimierung von beispielsweise Flügeln, Turbinen oder Oberflächen [16] und beider Generierung von optimalen Trajektorien und Vorsteuerungen [21] Verwendung. Für denÜbergang von der Steuerung hin zur Regelung muss hingegen die Optimierung online gelöstwerden, wofür der Großteil der aufgeführten Ansätze ungeeignet ist, da die benötigten Re-chenzeiten die verfügbaren stark übersteigen. Der Schritt hin zur Regelung im geschlossenenKreis wurde in [64] für die Burgersgleichung vollzogen, indem das Optimalsteuerungsproblem

4

Page 17: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

1.2 Stand der Technik

offline für eine große Anzahl von Anfangsbedingungen gelöst wurde. Das Schließen des Re-gelkreises erfolgt hier durch den zu jedem Aufruf des Reglers durchgeführten Abgleich desaktuellen Systemzustands mit den gespeicherten Anfangsbedingungen und der anschließendenAusgabe der zugehörigen optimalen Stellgröße. Dadurch wird die optimale Steuerung zu einerRegelung mit einer der expliziten modellprädiktiven Regelung (MPR) vergleichbaren Struktur.

Die bisher aufgeführten Verfahren des modellbasierten Reglerentwurfs werden auch unterdem Begriff der late-lumping-Verfahren subsumiert. Zur praktischen Implementierung der aufPDE-Basis entworfenen Regler muss eine Ortsdiskretisierung und Reduktion des Reglerge-setzes vorgenommen werden, sofern die entstandene Reglerstruktur hinreichend komplex ist[71]. Durch die Diskretisierung wird dabei aus der partiellen Differentialgleichung des Reglersein System gewöhnlicher Differentialgleichung mit endlich vielen Gleichungen. Der Begriff deslate lumping rührt daher, dass die Diskretisierung nach dem eigentlichen Reglerentwurf vorge-nommen wird. Dadurch werden diese Verfahren von den early-lumping-Ansätzen abgegrenzt.Bei diesen erfolgt die Diskretisierung vor dem eigentlichen Entwurf des Reglers. Zunächst wirdbeim early lumping das ortsverteilte System im Ort diskretisiert um ein System von ODEsfür das zu regelnde System zu erhalten. Dabei werden wichtige strukturelle Eigenschaftender PDE für das System von ODEs übernommen: Beispielsweise ergibt sich im Falle einernichtlinearen PDE ein System nichtlinearer ODEs. Für das entstandene System von ODEssind nach der Diskretisierung die gängigen modellbasierten Reglerentwurfsverfahren für ODE-Systeme anwendbar. Der wesentliche Unterschied beider Verfahren besteht also darin, ob dieDiskretisierung vor dem eigentlichen Reglerentwurf (early lumping) oder nach dem eigentli-chen Reglerentwurf (late lumping) vorgenommen wird. Während die Unterteilung in early undlate lumping vor allem in der Regelungstechnik gebräuchlich ist, wird in der Optimierung meistvon differentiate-then-discretize (analog zum late lumping) und discretize-then-differentiate(analog zum early lumping) gesprochen [42], [52].

Bei der Ortsdiskretisierung des early lumping tritt ein grundlegender Zielkonflikt zutage. Ei-nerseits soll der durch die Diskretisierung der PDE entstehende Diskretisierungsfehler kleingehalten werden. Das bedeutet, dass die Auflösung der Diskretisierung sehr fein gewähltwerden muss. Dieses Phänomen ist im Umfeld der Strömungsprozesse insbesondere bei dernumerischen Lösung der instationären Navier-Stokes-Gleichungen bekannt. Dort versuchendie direkten numerischen Simulationen (DNS) selbst die kleinskaligen turbulenten Schwan-kungen vollständig aufzulösen, was in einer enormen Anzahl an verwendeten Gitterpunktenresultiert. Wählt man eine gröbere Auflösung, so entstehen Fehler, da die kleinskaligen tur-bulenten Strukturen nicht aufgelöst werden, welche in der numerischen Strömungsmechanikdurch entsprechende Turbulenzmodelle verringert werden sollen. Andererseits stellt nicht nurdie Lösung von Systemen mit extrem hoher Dimension, sondern insbesondere der zugehörigeReglerentwurf Ansprüche an die verfügbare Rechenleistung, die in der Praxis mit Echtzeit-anwendungen heutzutage bei weitem nicht befriedigt werden können. Um den Zielkonfliktzwischen der Fehlerminimierung beim Übergang von PDEs zu ODEs und der Bereitstellungvon Modellen niedriger Dimension für den Reglerentwurf zu lösen, werden Methoden der Mo-dellreduktion eingesetzt. Im Falle von Strömungsprozessen erfreut sich hierbei insbesonderedie Galerkin-Projektion großer Beliebtheit [76]. Die Galerkin-Projektion, die die PDE in ein

5

Page 18: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

1 Einleitung

System von ODEs überführt, muss für eine erfolgreiche Modellreduktion mit Verfahren derDimensionsreduktion kombiniert werden, welche die Basisfunktionen liefern, auf welche inder Galerkin-Projektion projiziert wird. Hierfür stellt die Proper Orthogonal Decomposition(POD) die Referenzmethode für Strömungsprozesse dar [53]. Die Kombination von Galerkin-Projektion und POD wurde vielfach erfolgreich mit verschiedenen Reglerentwürfen kombiniert– im Falle einer MPR beispielsweise in [45]. Zudem existieren seit kurzer Zeit auch angepass-te POD-Galerkin-Verfahren, wenn die reduzierten Modelle in einem anschließenden Entwurfeines Optimalreglers mit endlichen Horizont Verwendung finden sollen [5].

Im Umfeld der Strömungsprozesse sind neben der POD auch andere Methoden zur Modell-beziehungsweise Dimensionsreduktion untersucht worden, wobei [96] eine gute Übersicht überdie zahlreichen Anwendungen bietet. Als Verfahren sind vor allem die Balanced POD (BPOD)[95], die Balanced truncation [75], der Eigensystem Realization Algorithm (ERA) [56] unddie Dynamic Mode Decomposition (DMD) [100] zu nennen. Diese Methoden werden aberaufgrund ihrer linearen Annahmen bezüglich des zu reduzierenden Systems in der Regel nurfür lineare Systeme (wie beispielsweise linearisierte Strömungen oder Strömungen um einenArbeitspunkt herum) verwendet und konnten für nichtlineare Strömungsprozesse oft keineverbesserten Ergebnisse im Vergleich zur POD erzielen [96]. Daher wurden für nichtlineareSysteme auch nichtlineare Dimensionsreduktionsmethoden untersucht. Hier ist die CentroidalVoronoi Tesselation (CVT) zu nennen, die in [19] untersucht wurde und bei geeigneter Pa-rametrierung der Methode verbesserte Ergebnisse liefern konnte. In [125] wurde die DiscreteEmpirical Interpolation Method (DEIM) dazu genutzt, das reduzierte Modell, welches überdie POD gewonnen wurden, durch eine nichtlineare Korrektur zu verbessern. Insgesamt fehltfür den Einsatz nichtlineare Dimensionsreduktionsmethoden allerdings ein einheitliches Fra-mework, wie diese günstig mit der Galerkin-Projektion verbunden werden können. Dadurch istdie POD in den allermeisten Anwendungen nach wie vor die Methode der Wahl. Doch auchbei der POD gibt es noch offene Fragen, von denen insbesondere zwei in der Wissenschaftregelmäßig adressiert werden: Die Stabilisierung und der Gültigkeitsbereich der reduziertenModelle.

Die Problematik der Stabilisierung reduzierter Modelle wird unter dem Schlagwort der ClosureModels diskutiert. Den Closure Models liegt die Beobachtung zugrunde, dass im Falle einerModellreduktion für ein stabiles System das entstehende reduzierte Modell instabil sein kann[99]. Dieser Effekt ist insbesondere bei der Modellreduktion von nichtlinearen Strömungspro-zessen mit hoher Reynoldszahl festzustellen. Die Aufgabe der Closure Models ist es, zentraleEigenschaften des zu reduzierenden Systems – wie zum Beispiel Stabilität – für das reduzier-ten Modell zu erhalten. Im Falle der Strömungsprozesse kann dies in gewisser Analogie zu demEinführen der subskaligen Turbulenzmodellen verstanden werden, die den durch die zu grobenDiskretisierung entstandenen Fehlern Rechnung tragen [80]. In Anlehnung an die Turbulenz-modelle werden daher meistens zusätzliche fiktive Viskositäten eingesetzt, um die reduziertenModelle stabil zu halten. Die richtige Wahl dieser Viskositäten spielt dabei für die Qualität derreduzierten Modelle eine entscheidende Rolle. In der Literatur existieren zahlreiche Strategienzur optimalen Kalibrierung der Viskosität. Dazu werden wahlweise Parameteridentifikationenauf Basis des reduzierten Modells wie in [25], [26] und [27] oder auf Basis von Simulationsda-

6

Page 19: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

1.3 Zielsetzung und Gliederung der Arbeit

ten [81] verwendet. Damit wird das Problem der Closure Models auf das klassische Problemder Parameteridentifikation zurückgeführt. Weitere Ansätze bestimmen die Viskosität durchLernen, das entweder im Zuge der Modellreduktion [13] oder online während der Regelung[14] durchgeführt wird.

Ein weiteres Problem bei der Modellreduktion für Strömungsprozesse ist der durch die Nicht-linearität eingeschränkte Gültigkeitsbereich der reduzierten Modelle. Dabei hat sich insbeson-dere die POD als nicht robust für nichtlineare dynamische Systeme erwiesen [107]. Dies liegtunterem anderem daran, dass die POD – wie nahezu sämtliche Dimensionsreduktionsverfahren– auf Daten des zu reduzierenden Systems operiert. Da die Daten nur ausgewählte Arbeits-punkte abdecken, fließen nur die Informationen dieser Arbeitspunkte in das reduzierte Modellein. Die fehlende Robustheit äußert sich nun darin, dass ein für einen bestimmten Arbeits-punkt erstelltes Modell keinerlei Aussagekraft für einen anderen Arbeitspunkt haben muss,selbst wenn der Abstand beider Punkte zueinander vergleichsweise klein ist. Daher wurden inder Literatur parametrische Modellreduktionsverfahren vorgeschlagen, die den Arbeitspunktals zusätzlichen Parameter in der Modellreduktion berücksichtigen. Hier ist an erster Stelle[12] als einschlägiges Übersichtswerk zu nennen. Das generelle Ziel der verwendeten Verfahrenist es, anhand von reduzierten Modellen, die für mehrere Parameterwerte (sprich: Arbeitspunk-te) gewonnen wurden, das reduzierte Modell für einen neuen Parameterwert zu bestimmen.Dabei werden meist direkt die Modelle interpoliert, wobei auf Verfahren wie die tangentialeInterpolation [6], Moment Matching [38], oder die direkte Interpolation von Übertragungs-funktionen oder Zustandsraummatrizen zurückgegriffen wird. All diese Verfahren entstammender linearen Theorie und zielen in erster Linie darauf, Balancierungen der Gramiane [7] odera priori Fehlerabschätzungen [12] zu minimieren. Im Falle nichtlinearer Modelle sind dieseVerfahren der direkten Modellinterpolation nicht anwendbar. Als zweiter Weg neben der di-rekten Modellinterpolation eröffnet sich bei projektionsbasierten Modellreduktionsverfahren,zu denen auch die POD zählt, die Möglichkeit, statt der Modelle die zugehörigen Unterräumeder Projektion zu interpolieren [2], [3], [12], [15]. Die Modelle werden hier erst in einem zwei-ten Schritt aus den interpolierten Unterräumen errechnet. Trotz der grundsätzlich gegebenenVereinbarkeit dieser Interpolationsvariante mit dem Galerkin-Verfahren für nichtlineare PDEs,hat diese Methodik es noch nicht in die regelungstechnischen Anwendung für nichtlineareSysteme geschafft.

1.3 Zielsetzung und Gliederung der Arbeit

Die Analyse des Stands der Technik zeigt, dass zwei getrennte Ansätze zur modellbasier-ten Regelung nichtlinearer Strömungsprozesse existieren. Auf der einen Seite steht das latelumping, das sich auf den Reglerentwurf für die PDE fokussiert und die für die praktischeUmsetzung oft relevanten Aspekte der Modellreduktion nur wenig betrachtet. Auf der ande-re Seite befindet sich das early lumping, welches sich hauptsächlich mit der Modellreduktionauseinander setzt und der nachfolgenden Reglerstruktur oft eine nur untergeordnete Rolle bei-misst. Des Weiteren kommen bei der Modellreduktion mit der POD und ihren Alternativen

7

Page 20: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

1 Einleitung

aus der linearen Welt Methoden zur Anwendung, die nicht genuin auf die nichtlineare Charak-teristik der Strömungsprozesse zugeschnitten sind. Ähnliches gilt für die Robustifizierung derreduzierten Modelle über parametrische Modellreduktion, die meist auf linearen Methodenbasiert, oder über die Closure Models, welche häufig auf eine austauschbare Parameteriden-tifikation hinauslaufen.

Die Zielsetzung dieser Arbeit ist daher zweigeteilt: Erstens ist es das Ziel, Methoden derModellreduktion bereitzustellen, die auf die Bedürfnisse der nichtlinearen Strömungsprozesseangepasst sind. Diese Methoden umfassen dabei den Modellreduktionsprozess von der Dimen-sionsreduktion bis zur Robustifizierung der reduzierten Modelle. Zweitens möchte diese Arbeitdie Unterteilung in late lumping und early lumping in dem Sinne ein Stück weit aufbrechen,als dass der Vorgang des Reglerentwurfs für PDEs und der Vorgang der Modellreduktion alsein ganzheitliches methodisches Problem aufgefasst wird. Dieses zweite Ziel entspricht damiteinem der in [71] von Thomas Meurer formulierten Ziele für die regelungstechnische For-schung bezüglich PDEs in der Zukunft. Das stärkere Zusammenführen von Modellreduktionund Reglerentwurf soll dadurch erfolgen, dass die Modellreduktionsmethoden des early lum-pings auf die Reihenfolge des late lumpings übertragen werden, indem die Modellreduktionnicht nur auf die PDE angewandt wird, welche die Regelstrecke beschreibt, sondern auchauf die PDE, welche den über das late lumping berechneten Regler beschreibt. Zur Regelungwerden dabei die Verfahren der optimalen Steuerung in einer der MPR verwandten Ablauf-struktur verwendet, da diese sich gut auf nichtlineare Strömungsprozesse anwenden lassen.

Aufgrund der formulierten Zielsetzung besitzt diese Arbeit zwei methodische Abschnitte, diesich den beiden Teilen der Zielsetzung widmen. Zum Verständnis und zur Einordnung die-ser beiden Abschnitte werden ihnen drei Abschnitte zur Seite gestellt, die die zugehörigenGrundlagen behandeln. In Orientierung an den Titel der Arbeit gibt es dabei jeweils einenGrundlagenabschnitt zu Strömungsprozessen, zur Modellreduktion und zur optimalen Rege-lung. Genauer aufgeschlüsselt gliedert sich die Arbeit wie folgt: Im Anschluss an die Einleitungin Abschnitt 1, die mit dieser Gliederung abschließt, behandeln die Abschnitte 2 und 3 dieGrundlagen der Strömungsprozesse und der Modellreduktion, die für das Verständnis und dieEinordnung des folgenden Abschnitts 4 essentiell sind. Dabei ist Abschnitt 2 in zwei Kapitelunterteilt. Im ersten Kapitel 2.1 wird der Zusammenhang zwischen Strömungsprozessen undnichtlinearen partiellen Differentialgleichungen hergestellt, während sich das zweite Kapitel2.2 der Lösung partieller Differentialgleichungen widmet. Die Grundlagen der Modellreduk-tion über die Kombination von POD und der Galerkin-Projektion werden in Abschnitt 3dargelegt, wobei Kapitel 3.1 die Galerkin-Projektion und Kapitel 3.2 die POD erläutert.

Im Anschluss an diese Grundlagen werden für nichtlineare Strömungsprozesse angepasstenMethoden in zwei Abschnitten behandelt. Dabei stehen in Abschnitt 4 die Methoden derModellreduktion im Vordergrund, wobei in Kapitel 4.1 nichtlineare Alternativen zur POD,in Kapitel 4.2 interpolierte reduzierte Modelle und in Kapitel 4.3 die Adaption der redu-zierten Modelle über Closure Models untersucht werden. Dem gegenüber steht Abschnitt 6,der sich mit dem zweiten Ziel dieser Arbeit beschäftigt und ein neuartiges Regelungskonzept

8

Page 21: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

1.3 Zielsetzung und Gliederung der Arbeit

vorstellt, in welchem die aus der optimalen Steuerung von PDEs entstehenden Optimalitäts-bedingungen, die selbst ebenfalls PDEs sind, einer Modellreduktion unterzogen werden, umden optimalen Stelleingriff des Reglers zu berechnen. Die für 6 notwendigen Grundlagen deroptimalen Steuerung partieller Differentialgleichungen werden in dem eingeschobenen Grund-lagenabschnitt 5 behandelt.

Zur Veranschaulichung der vorgestellten Methoden dienen die Anwendungsbeispiele in Ab-schnitt 7. Ausgehend von den zweidimensionalen inkompressiblen Navier-Stokes-Gleichungenals erstem Beispiel eines realitätsnahen aber dennoch mathematischem Strömungsmodellsin Kapitel 7.1 erfolgt der Übergang zu zwei praxisnahen Anwendungsfällen. Die Tatsache,dass mit der Widerstandsreduktion einer überströmten Platte in Kapitel 7.2 und mit derWärmekonvektion in einem Festbettspeicher in Kapitel 7.3 zwei sehr unterschiedliche Strö-mungsprozesse als Beispiele dienen, soll dabei die generellere Anwendbarkeit der präsentiertenMethodik unterstreichen. Abschnitt 8 fasst die Ergebnisse der Arbeit zusammen und gibt einenAusblick auf weitere mögliche Forschungstätigkeiten.

9

Page 22: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse
Page 23: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

2 Grundlagen der Strömungsprozesse

2.1 Modellierung von Strömungen

Eine wesentliche Eigenschaft von Strömungsprozessen ist es, dass diese über partielle Differen-tialgleichungen modelliert und beschrieben werden. Das soll durch die Hervorhebung wichtigerSchritte in der Herleitung klassischer Gleichungen für Strömungsprozesse verdeutlicht werden.Diese Gleichungen bilden zudem den Ausgangspunkt für die Strömungsprozesse, die in Kapitel7 als Anwendungsbeispiele dienen werden. Die Ausführungen orientieren sich hierbei an [105],[112] und [123]. Der Zweck der Herleitungen ist dabei weniger das Aufstellen sehr bekannterGleichungen, sondern die Verdeutlichung zweier Tatsache: Strömungsprozesse müssen durchPDEs beschrieben werden und sind inhärent nichtlinear.

Als Erstes wird die zeit- und ortsabhängige skalare Eigenschaft η(t,x) ∈ R innerhalb einesräumlich festen Kontrollvolumens x ∈ Ω ⊂ Rn betrachtet. Das Kontrollvolumen Ω ist dabeieine offene, beschränkte und nichtleere Menge mit stückweise glattem C1-Rand ∂Ω. Diezeitliche Änderung der Eigenschaft η über das Kontrollvolumen lautet dann

d

dt

∫Ω

η(t,x) dΩ mit t ∈ R. (2.1)

Sind sowohl η als auch die partielle Ableitung ∂η∂t

stetig in t und x, so ist die Leibniz-Regelfür das Vertauschen von Integral und Ableitung anwendbar und man erhält

d

dt

∫Ω

η(t,x) dΩ =∫Ω

∂η

∂t(t,x) dΩ. (2.2)

Zudem kann sich die Eigenschaft η in Ω nur dann ändern, wenn es entweder einen Flussvon η über den Rand ∂Ω von Ω gibt oder sich Quellen und Senken QS innerhalb von Ωbefinden. Mathematisch formuliert lautet dieses auch als Transportgesetz von Reynolds [18]bezeichnete Prinzip

d

dt

∫Ω

η dΩ = −∫∂Ω

ηv · n dA−∫Ω

QS dΩ (2.3)

11

Page 24: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

2 Grundlagen der Strömungsprozesse

mit der Fließgeschwindigkeit v der Strömung und dem auf der Oberfläche A senkrecht stehen-den und nach außen weisenden Normalenvektor n. Die Variable QS fasst dabei die Gesamtheitaller Quellen und Senken in Ω zusammen. Ist der Rand ∂Ω zudem abschnittsweise glatt, Ωkompakt und v stetig differenzierbar, so ist auch ηv stetig differenzierbar und der GaußscheIntegralsatz anwendbar. Damit folgt

∫Ω

∂η

∂tdΩ = −

∫∂Ω

ηv · n dA−∫Ω

QS dΩ = −∫Ω

div(ηv) +QS dΩ. (2.4)

Da die Beziehung in (2.4) für ein beliebiges Kontrollvolumen Ω gültig ist, müssen die Integran-den auf beiden Seiten der Gleichung identisch sein. Daher gilt allgemein für Strömungen

∂η

∂t+ div(ηv) +QS = 0. (2.5)

Die Gleichung (2.5) bedeutet, dass sich eine skalare Eigenschaft η nur durch entsprechendeQuellen und Senken QS oder mit der Divergenz der Strömung div(ηv) verändern kann. Da dieDivergenz Ortsableitungen beinhaltet, während ∂

∂teine Zeitableitung enthält, ist durch (2.5)

der grundlegende partielle Charakter von strömungsbeschreibenden Differentialgleichung ab-lesbar: Jede Strömung muss wegen div(ηv) in ihrem dynamischen Verhalten über eine PDEbeschrieben werden.

Neben der Betrachtung eines räumlich fixierten Kontrollvolumens ist es bei Strömungen eben-so möglich, ein einzelnes infinitesimal kleines Strömungspartikel zu verfolgen. Im Gegensatzzu der Sichtweise eines räumliche festen Kontrollvolumens bewegt sich hier der Beobachtermit dem Partikel durch die Strömung mit. Für die skalare Eigenschaft η(t,x) des Partikelsgilt dann nach der Kettenregel

dt= ∂η

∂t+ ∂η

∂x· ∂x∂t

. (2.6)

Mit Einsetzen der Strömungsgeschwindigkeit v und des Nabla-Operators ∇ in (2.6) ergibtsich die sogenannte substantielle Ableitung

dt= ∂η

∂t︸︷︷︸lokal

+ ∇η ·v︸ ︷︷ ︸konvektiv

. (2.7)

Sie beschreibt die Rate, mit welcher sich die skalare Eigenschaft η eines Fluidteilchens ändert,während es sich mit der Strömung mitbewegt. Die zwei durch die Kettenregel entstehendenAusdrücke beinhalten zum einen die zeitabhängige Änderung von η an dem Ort, an demsich das Teilchen soeben lokal befindet, und zum anderen die Änderung von η entlang derOrte, die das Partikel passiert, indem es sich mit der Strömung mitbewegt (Konvektion). Aus

12

Page 25: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

2.1 Modellierung von Strömungen

mathematischer Sicht handelt es sich bei der substantiellen Ableitung um die totale Ablei-tung, weshalb zur Unterscheidung von der partiellen Ableitung der Ausdruck d

dtanstelle von

∂∂t

verwendet wird. Aus Gleichung (2.7) ist zudem ersichtlich, dass die Betrachtung einergeschwindigkeitsabhängigen Eigenschaft η – wie beispielsweise dem Impuls des Fluidpartikelsin eine ausgewählte Koordinatenrichtung – einen inhärent nichtlinearen Charakter der resul-tierenden Gleichungen impliziert, da ∇η mit der Geschwindigkeit v multipliziert wird. Alleinaus der Analyse von Kontrollvolumina und der Verfolgung von Partikeln in Strömungen kanndaher abgeleitet werden, dass für die physikalische Modellierung von Strömungen nichtlinearepartielle Differentialgleichungen zu erwarten sind, sofern über Eigenschaften bilanziert wird,die geschwindigkeitsabhängig sind.

Wendet man nun die beiden hergeleiteten grundlegenden Prinzipien in (2.5) und (2.7) auf kon-krete physikalische Eigenschaften an, so kann man mathematische Gleichungen zur Beschrei-bung der Dynamik von Strömungen gewinnen. Die Eigenschaften der Wahl für physikalischeStrömungen sind dabei die Masse m = ρΩ mit der Dichte ρ und dem Volumen Ω sowie derImpuls mv mit der Geschwindigkeit v eines Strömungspartikels. Unter der Annahme der In-kompressibilität (das heißt, dass sich die Dichte eines Partikel im Strömungsfeld nicht ändert)und der eines Newtonschen Fluids (das heißt, dass Reibeffekte zwischen Strömungspartikelnproportional zu deren Relativgeschwindigkeiten sind) erhält man mit dem Druck p und demVektor der spezifischen äußeren Kräfte fa die wohlbekannten Navier-Stokes-Gleichungen fürinkompressible Strömungen

∂tv + (v ·∇)v − µ∆v +∇p = fa mit div(v) = 0. (2.8)

Hierbei ist zu beachten, dass ∆v den komponentenweise ausgeführten und damit vektorwer-tigen Laplace-Operator meint. Statt der Viskosität µ kann auch die Reynoldszahl Re = 1

µ

verwendet werden. Die Navier-Stokes-Gleichungen (2.8) beschreiben grundlegend die Dyna-mik von Strömungen und sind ein Satz nichtlinearer partieller Differentialgleichungen. DieNichtlinearität rührt dabei daher, dass der Impuls als bilanzierte Eigenschaft selbst geschwin-digkeitsabhängig ist. Im Rahmen der Herleitung wird dabei klar, dass sowohl die Nichtlinearitätals auch das Auftreten partieller Differentialgleichungen wesentlicher Bestandteil sowohl derNavier-Stokes-Gleichungen als auch allgemein jeder physikalisch bedeutsamen Beschreibungvon Strömungen sein muss.

Die sogenannte Burgersgleichung

∂v(t,x)∂t

= −v(t,x)∂v(t,x)∂x

+ µ∂2v(t,x)∂x2 (2.9)

mit x ∈ [0, 1] und v ∈ R ist ebenfalls eine grundlegende nichtlineare partielle Differential-gleichung, die als eindimensionale Variante der Navier-Stokes-Gleichungen verstanden werdenkann. Die Struktur der linearen und nichtlinearen Terme wurde dabei aus (2.8) übernommen,während die Massenerhaltung div(v) = 0 fallengelassen wurde, da diese im eindimensionalen

13

Page 26: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

2 Grundlagen der Strömungsprozesse

zu ∂v∂x

= 0 und damit zu einem vollständigen Verlust der Ortsabhängigkeit führen würde.Angreifende äußeren Kräfte werden ebenfalls nicht betrachtet. Besonders im mathematischenBereich wird die Burgersgleichung gerne verwendet, um Strategien oder Algorithmen für dieNavier-Stokes-Gleichungen in einem einfacheren Umfeld erstmals zu testen. Da insbesondereim Bereich von Strömungen viele Effekte erst in zwei oder drei Dimensionen zu Tage treten,ist eine Beschränkung auf die Burgersgleichung nicht ausreichend, sondern kann nur als ersterIndikator für Funktionalität und Leistungsfähigkeit fungieren. In dieser Arbeit soll die Burgers-gleichung als illustrierendes Beispiel mitgeführt werden, um sowohl die im Kapitel Grundlagendargestellten Methoden als auch in dieser Arbeit neu vorgestellten Ansätze anschaulicher zuerläutern und zu exemplifizieren, bevor diese in Kapitel 7 realitätsnäheren Anwendungsbei-spielen entgegentreten. Zusammenfassend soll nochmals festgehalten werden, dass im Rah-men wichtiger Schritte in der Herleitung der Navier-Stokes-Gleichungen verdeutlicht wurde,dass Strömungsprozesse notwendigerweise durch nichtlineare partielle Differentialgleichungenbeschrieben werden müssen. Die Nichtlinearität rührt dabei daher, dass sich geschwindig-keitsabhängige Eigenschaften, wie beispielsweise der Impuls, mit der örtlichen Bewegung vonStrömungspartikeln verändern.

2.2 Zur Lösung partieller Differentialgleichungen

Im vorangegangenen Kapitel wurde gezeigt, dass Strömungsprozesse durch nichtlineare par-tielle Differentialgleichungen beschrieben werden. Bevor zu den weiteren Grundlagen – wieder Modellreduktion oder der optimalen Steuerung dieser Gleichungen – übergegangen wer-den kann, ist es notwendig, mathematische Werkzeuge bereitzulegen, die eine geeignete Be-schreibung der Lösung von partiellen Differentialgleichungen ermöglichen. Die Darstellungder mathematischen Grundlagen der so genannten schwachen Lösung und der Distributionenorientiert sich dabei an [18] und [105].

2.2.1 Regularität von Lösungen

Gegeben sei eine partielle Differentialgleichung – beispielsweise die Burgersgleichung aus(2.9)

∂v(t,x)∂t

= −v(t,x)∂v(t,x)∂x

+ µ∂2v(t,x)∂x2

mit homogenen Dirichlet-Randbedingungen v(t, 0) = v(t, 1) = 0. Die Funktion v(t,x), diedie Burgersgleichung mit den formulierten Randbedingungen löst, muss offensichtlich im Ge-biet Ω = (0, 1) zweimal stetig differenzierbar sein, da ansonsten der Ausdruck ∂2v(t,x)

∂x2 nichtexistiert. Auch wenn die Differenzierbarkeit am Rand des Intervalls [0, 1] nicht sinnvoll gefor-dert werden kann, so muss die Funktion dort die Randbedingungen erfüllen. Die sogenannteklassische Lösung lebt daher im Funktionenraum v ∈ C2(Ω)∩C0(Ω) und erfüllt die Gleichung(2.9) punktweise. Hier bezeichnet Cn(Ω) den Raum der auf Ω n-fach stetig differenzierbaren

14

Page 27: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

2.2 Zur Lösung partieller Differentialgleichungen

Funktionen und Ω den Abschluss von Ω. Die Abhängigkeit der Funktion von der Zeit wurdezunächst ausgeklammert.

Aus mathematischer Sicht ist es jedoch oft nicht notwendig, derart starke Forderungen andie Regularität der Funktion v zu stellen, wie die klassische Lösung einer PDE dies tut. Wirddie Gleichung (2.9) zu beiden Seiten mit einer glatten Funktion ϕ(t,x) multipliziert undanschließend über den Ort integriert erhält man

∫Ω

∂v

∂tϕ dΩ = −

∫Ω

v∂v

∂xϕ dΩ + µ

∫Ω

∂2v

∂x2ϕ dΩ. (2.10)

Die Schreibweise dΩ ist dabei auch im Falle einer mehrdimensionalen Integration mit Ω ⊂ Rn

möglich, da v ∈ C2(Ω) gilt und daher nach dem Satz nach Fubini die Integrationsreihenfolgekeine Rolle spielt. Wendet man auf (2.10) die Rechenregeln der partiellen Integration an, soerhält man

−∫Ω

v∂ϕ

∂tdΩ =

∫Ω

12v

2∂ϕ

∂xdΩ− µ

∫Ω

∂v

∂x

∂ϕ

∂xdΩ, (2.11)

wobei die Homogenität der Randbedingung verwendet wurde. Die Funktion v muss in demAusdruck (2.11) nur die Bedingung erfüllen, dass v und ∂v

∂xsind entsprechend integrieren las-

sen. Für ϕ gelten die identischen Voraussetzungen. Diese Bedingung ist sehr viel schwächerals die Bedingungen, die an die klassische Lösung gestellt werden. Daher heißt eine Funktion,die (2.11) erfüllt auch schwache Lösung der partiellen Differentialgleichung. Jede klassischeLösung ist auch eine schwache Lösung, während eine schwache Lösung nur bei hinreichenderRegularität auch eine klassische Lösung ist. Im Gegensatz zur klassischen Lösung, welche diePDE punktweise erfüllt, löst die schwache Lösung die PDE in dem Sinne, als dass sie auf glatteFunktionen bezüglich der Auswertung der Integrale identisch wirkt. Dieses Resultat lässt sichüber das mathematische Konzept der Sobolev-Räume und der Distributionen formalisieren.

2.2.2 Funktionenräume

Im Folgenden ist Ω ⊂ Rn eine offenen, beschränkte, nichtlineare Menge mit stückweise C1-Rand. Dann bezeichnet Lp(Ω)d – in einer an [35] und [45] angelehnten Schreibweise – mit0 < p <∞ den Raum der p-fach integrierbaren Funktionen

Lp(Ω)d =

f : Ω→ Rd mitd∑i=1

∫Ω

fi(x)p dx <∞

. (2.12)

Mathematisch exakt leben im Lp(Ω) eigentlich keine Funktionen, sondern Äquivalenzklassenvon Funktionen, da die Definition in (2.12) Variationen von f auf Nullmengen zulässt. Von

15

Page 28: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

2 Grundlagen der Strömungsprozesse

besonderem Interesse innerhalb der Lp-Räume ist der Raum der quadratisch integrierbarenFunktionen L2(Ω)d, da es sich bei diesem um eine Hilbertraum (das heißt einen Raum mitSkalarprodukt, der bezüglich der vom Skalarprodukt induzierten Norm vollständig ist) handelt.Das zugehörige Skalarprodukt ist dabei

〈f , g〉L2 =d∑i=1

∫Ω

fi(x) · gi(x) dx (2.13)

und die durch das Skalarprodukt induzierte Norm dementsprechend

‖f‖L2 =√〈f , f〉L2 =

√√√√√ d∑i=1

∫Ω

fi(x)2 dx. (2.14)

Das obige Beispiel der Burgersgleichung hat gezeigt, dass es eine sinnvolle Voraussetzung ist,die Integrierbarkeit von v und seinen Ableitungen zu fordern.

Definition 1 Der Raum

Hk(Ω)d =f ∈ L2(Ω)d mit Dαf ∈ L2(Ω)d für |α| ≤ k

(2.15)

heißt Sobolev-Raum, wobei Dαf den Multiindex

Dαf =(∂α1

∂α1x1

). . .

(∂αn

∂αnx1

), |α| =

n∑i=1

αi (2.16)

bezeichnet.

Der RaumHk(Ω)d enthält genau die Funktionen, die zusammen mit ihren ersten k-Ableitungenim L2(Ω)d leben. Die Multiindex-Schreibweise erleichtert hierbei die Aufteilung der Ableitungauf die verschiedenen Koordinatenrichtungen. Auch der Hk(Ω)d ist ein Hilbertraum mit demSkalarprodukt

〈f , g〉Hk =∑|i|,|j|≤k

〈Djf ,Dig〉L2, (2.17)

welches alle möglichen L2-Skalarprodukte zwischen den Funktionen und ihren Ableitungensummiert. Die induzierte Norm ‖f‖Hk ist analog zu (2.14) definiert. Des Weiteren ist derSobolev-Raum mit Nullrandbedingung Hk

0

Hk0 (Ω)d =

f ∈ Hk(Ω)d und f = 0 auf ∂Ω

, (2.18)

ebenfalls ein Hilbertraum. All diese Funktionen berücksichtigen bisher nicht die Zeitabhängig-keit, die für die Lösung der partiellen Differentialgleichungen für Strömungen jedoch gefordert

16

Page 29: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

2.2 Zur Lösung partieller Differentialgleichungen

ist. Hierfür steht das Konzept der Bochner-integrierbaren Funktionen zur Verfügung [52]. Aufden hier vorliegenden Anwendungsfall angepasst wird der Bochner-Raum

Hk0 (T , Ω)d =

f : T × Ω→ Rd mit∫T

‖f(t, ·)‖Hk dt <∞

(2.19)

definiert. Hierbei ist T ⊂ R das betrachtete Zeitintervall, über welches die Funktion f , diepunktweise für alle Zeitpunkt im Hk(Ω) lebt, integrierbar ist. Auf analoge Weise ist derL2(T , Ω)d definiert.

Wendet man das Konzept der Sobolev-Räume auf die bereits erfolgte Betrachtung in 2.2.1bezüglich der benötigten Regularität der Lösung der Burgersgleichung an, erkennt man, dassin (2.11) v und ∂v

∂xfür ein festes Zeitintervall T im L2(T , Ω) liegen müssen. Da die Randbedin-

gungen homogen sind, liegt also die Lösung gemäß (2.11) im H10 (T , Ω). Schwache Lösungen

von PDEs leben daher im Gegensatz zu den klassischen Lösungen in Sobolev- beziehungsweiseBochner-Sobolev-Räumen. Zudem ist anzumerken, dass die geforderte Glattheit der Funktionϕ in (2.10) und (2.11) ebenfalls bedeutet, dass diese aus einem Sobolev-Raum stammt.

2.2.3 Distributionen

Bei einer weiteren Betrachtung der notwendigen Regularität der Lösung der Burgersgleichungin (2.9) stellt sich jedoch, die Frage, warum die Rechenregeln der partiellen Integration nureinmal angewandt werden und die schwache Lösung somit imH1

0 (T , Ω) gesucht werden sollte.Wendet man diese Rechenregel in (2.11) ein weiteres mal an, so erhält man

−∫Ω

v∂ϕ

∂tdΩ =

∫Ω

12v

2∂ϕ

∂xdΩ + µ

∫Ω

v∂2ϕ

∂x2 dΩ. (2.20)

In (2.20) ist v ∈ L2(T , Ω) und ϕ ∈ H20 (T , Ω), während in (2.11) noch v,ϕ ∈ H1

0 (T , Ω) galt.Durch die erneute Anwendung der partiellen Integration wurde also die geforderte Regularitätweiter von v nach ϕ transferiert. Da aber ϕ eine beliebige Funktion und damit auch einepotentiell beliebig glatte Funktion repräsentiert, kann diese Eigenschaft durch den verallge-meinerten Funktionsbegriff der Distributionen, welcher auch zum Verständnis der Galerkin-Projektion und der optimalen Regelung von PDEs hilfreich ist, nutzbar gemacht werden:

Definition 2 Eine Funktion f heißt Testfunktion, wenn f ∈ C∞0 (Ω) gilt, das heißt: f istunendlich oft differenzierbar und außerhalb eines kompakten Trägers identisch Null.

Definition 3 Eine Abbildung f heißt Distribution, wenn f : C∞0 (Ω) → R gilt und f linearund stetig ist.

17

Page 30: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

2 Grundlagen der Strömungsprozesse

Das bedeutet, dass Distributionen Testfunktionen auf reelle Zahlen abbilden. Die Definitionder Stetigkeit wird oft durch eine allgemeiner gültige Abschätzung ersetzt, die geringeretopologische Strukturen voraussetzt, was aufgrund der mathematischen Übersichtlichkeit hierunterschlagen wird. Distributionen können als verallgemeinerter Funktionsbegriff aufgefasstwerden, denn so kann beispielsweise jede Funktion f ∈ L2(Ω) über

f(ϕ) = 〈f ,ϕ〉L2 =∫Ω

fϕ dΩ (2.21)

eindeutig einer Distribution f zugeordnet werden. Eine analoge Zuordnung ist auch für Rd

und den L2(Ω)d möglich. Distributionen sind jedoch nicht nur Funktionen, sondern verallge-meinerte Funktionen, da es Abbildungen gibt, die Distributionen aber keine Funktionen sind.Der prominenteste Vertreter hierfür aus der Regelungstechnik ist die Dirac-Distribution

δ : C∞0 → R , ϕ→ ϕ(0) (2.22)

Im Sinne von (2.21) entspräche die Dirac-Distribution einer Funktion f , die außer in x = 0Null wäre, dort unendlich und das Integral über sie identisch Eins. Während eine solche Funk-tion nicht wohldefiniert ist, ist die Dirac-Distribution wohldefiniert – auch ohne die Existenzeiner Funktion f . Zudem lässt sich die Dirac-Distribution im Gegensatz zu der (nicht wohl-definierten) Funktion auch ableiten, da sich dem folgenden Satz jede Distribution beliebig oftableiten lässt.

Satz 1 Für die k-te Ableitung ∂kf der Distribution f : C∞0 → R gilt: ∂f(ϕ) = (−1)kf(∂kϕ).

Der Beweis von Satz 1 erfolgt analog zu (2.11) über die Rechenregeln der partiellen Integrati-on. Die Terme, die die Randintegrale enthalten, verschwinden aufgrund des kompakten Trägervon ϕ. Da ϕ eine Testfunktion ist, existiert ∂kϕ stets und der Ausdruck ist wohldefiniert. DieAussage ist ebenso bei der Verwendung von Multiindizes gültig.

Die Distributionen sind mit der Konstruktion der schwachen Lösung von PDEs eng verwandt.Die Lösung der partiellen Differentialgleichung in (2.20) entspricht durch das Transferierender Ableitung hin auf die Testfunktion ϕ der Lösung der PDE im distributionellen Sinne.Zusammenfassend soll in der vorliegenden Arbeit der folgende schwache Lösungsbegriff fürpartielle Differentialgleichungen verwendet werden (vergleiche [105]).

Definition 4 Gegeben sei eine partielle Differentialgleichung F(f , ∂f , . . . , ∂αf) = 0 mithomogenen Randbedingungen. Eine Abbildung f heißt schwache Lösung von F , wenn f ∈ H1

0und F(f , ∂f , . . . , ∂αf) = 0 im Sinne der Distributionen gilt.

18

Page 31: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

2.2 Zur Lösung partieller Differentialgleichungen

Diese Definition ist äquivalent zu der Aussage, dass 〈f ,G(ϕ, ∂ϕ, . . . , ∂αϕ)〉L2 = 0 für alleϕ ∈ C∞C gilt, wobei G der formal adjungierte Operator zu F ist, der sich aus der partiellenIntegration ergibt. Die Forderung f ∈ H1

0 stellt die Verbindung zum schwachen Lösungsbegriffin (2.11) her und sorgt für die Beibehaltung geringer Regularitätseigenschaften in f . Für α = 2– wie im Falle der Burgersgleichung oder auch der Navier-Stokes-Gleichungen – können sowohlf als auch ϕ aus dem H1

0 gewählt werden. Die Definition 4 lässt sich ebenso auf Problemeohne homogene Randbedingungen übertragen. Der vorgestellte schwache Lösungsbegriff wirdim Galerkin-Verfahren zur Approximation der partiellen Differentialgleichung verwendet.

19

Page 32: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse
Page 33: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3 Grundlagen der Modellreduktion

3.1 Galerkin-Projektion

Nachdem in Kapitel 2.2 Lösungseigenschaften partieller Differentialgleichungen diskutiert wur-den, stellt sich die Frage, wie die Lösung einer PDE denn nun ermittelt werden kann. Nebender analytischen Lösung ist dabei im Zeitalter zunehmender Rechenkapazität die näherungs-weise Lösung über numerische Verfahren ebenfalls von Interesse. Die Galerkin-Projektion isteine etablierte Methode zum Bestimmen der numerischen Lösung, die sich die distributionelleschwache Lösung der PDE zu Nutze macht, um daraus ein System gewöhnlicher Differenti-algleichungen abzuleiten, das im Rahmen eines Separationsansatzes für die Lösung der PDEnotwendigerweise erfüllt sein muss. Da die Modellreduktionmethoden in dieser Arbeit wei-terentwickelt werden sollen, ist die Darstellung vergleichsweise genau und Beweise werdenzum Teil mit angegeben, um die Einbettung der Weiterentwicklung in das etablierte theore-tische Gesamtkonzept besser nachvollziehen zu können. Die folgende Darstellung folgt dabeiin groben Zügen [23], [24], [53] und [76].

3.1.1 Der Weg zur gewöhnlichen Differentialgleichung

Zunächst wird angenommen, dass die Randbedingungen der partiellen Differentialgleichunghomogen sind. Die schwache Lösung der Burgersgleichung nach Definition 4 lautet unterVerwendung des Skalarproduktes

〈∂v∂t

+ v∂v

∂x− µ∂

2v

∂x2 ,ϕ〉L2 = 0 ∀ϕ ∈ H10 (T , Ω), (3.1)

wobei auch v ∈ H10 (T , Ω) gilt. Wählt man nun den Separationsansatz va zum Lösen der

schwachen Formulierung (3.1)

va(t,x) =∑i

ai(t)ψ(i)(x) (3.2)

21

Page 34: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3 Grundlagen der Modellreduktion

mit den Basisfunktionen ψ(i)(x) ∈ H10 (T , Ω) aus der Basis ψ und den zeitabhängigen

Koeffizienten a(t) und setzt diesen in (3.1) ein, so erhält man

〈∂va∂t

+ va∂va∂x− µ∂

2va∂x2 ,ϕ(x)〉L2 = (3.3)

〈∑i

ai(t)ψ(i)(x) +∑i

ai(t)ψ(i)(x)∑j

aj(t)∂ψ(j)(x)∂x

− µ∑i

ai(t)∂2ψ(i)(x)∂x2 ,ϕ(x)〉L2 = 0.

Hierbei wurde ausgenutzt, dass a(t) nicht von der Ortskoordinate x und ψ(x) nicht von derZeit t abhängig ist. Der Separationsansatz ist dabei möglich, da der Raum H1

0 (Ω) separabelist, das heißt, dass es eine abzählbare Menge an ψ gibt, die dicht im H1

0 (Ω) liegt. Aufgrundder homogenen Randbedingungen erfüllt der Separationsansatz (3.2) ebenfalls die Randbe-dingungen, da alle Basisfunktionen ψ(i)(x) diese erfüllen. Damit der Separationsansatz (3.2)die schwache Formulierung der PDE löst, muss (3.3) für alle Testfunktionen ϕ ∈ H1

0 (T , Ω)erfüllt sein. Da aufgrund der Konstruktion der distributionelle Lösung ψ(i) und ϕ für alle iaus demselben Raum kommen, muss daher (3.3) insbesondere für ϕ = ψ(i) erfüllt sein.

Die Wahl der Basisfunktionen als Ansatzfunktionen des Separationsansatzes (3.2) unterliegtvielen Freiheiten. Daher erscheint es vernünftig, günstige Eigenschaften der Basisfunktionendes Separationsansatzes zu fordern. Konkret bedeutet dies, dass die Menge ψ zum einenlinear unabhängig ist und damit eine Basis des durch sie aufgespannten Unterraums ist.Zum anderen wird gefordert, dass die Menge ψ orthonormal ist, was bedeutet, dass durch‖ψ(i)‖L2 = 1 ∀i alle Elemente der Menge ψ(i) normiert sind und paarweise orthogonal zueinander stehen:

〈ψ(i),ψ(j)〉L2 = 0 für i 6= j. (3.4)

Hier wird dabei das Skalarprodukt und die Norm des L2 und nicht die des H10 verwendet.

Diese Wahl ist möglich, da der H10 ein Unterraum des L2 ist.

Da – wie weiter oben bereits geschildert – (3.3) auch für ϕ(i) = ψ(i) erfüllt sein muss, kanndiese Identität in (3.3) eingesetzt werden. Unter Verwendung der Orthonormalität ergibt sichdie Gleichung

〈∑i

aiϕ(i) +

∑i

aiϕ(i)∑

j

aj∂ϕ(j)

∂x− µ

∑i

ai∂2ϕ(i)

∂x2 ,ϕ(k)〉L2 = (3.5)

ak(t) + 〈∑i

aiϕ(i)∑

j

aj∂ϕ(j)

∂x,ϕ(k)〉L2 − µ

∑i

ai〈∂2ϕ(i)(x)∂x2 ,ϕ(k)〉L2 = 0.

Bei (3.5) handelt es sich um eine gewöhnliche Differentialgleichung für den zeitabhängigenKoeffizienten ak. Da k beliebig gewählt war, kann man (3.5) für alle k unter Einführung desVektors ai = ai als

22

Page 35: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3.1 Galerkin-Projektion

a = aqa+ µLa (3.6)

schreiben. Hierbei sind die Matrix L und der dreistufige Tensor q als

qijk = −〈ϕ(i)(x) · ∂ϕ(j)

∂x(x),ϕ(k)(x)〉L2 (3.7)

Lik = 〈∂2ϕ(i)

∂x2 (x),ϕ(k)(x)〉L2

definiert. Die Herleitung ist auch für andere Skalarprodukte als das L2-Skalarprodukt möglich.Die Nichtlinearität der Burgersgleichung hat sich dabei auf die gewöhnliche Differentialglei-chung übertragen.

Durch die nichtlineare gewöhnliche Differentialgleichung (3.6), die im Folgenden auch alsGalerkin-Modell bezeichnet wird, werden die zeitabhängigen Koeffizienten des Separations-ansatzes festgelegt. Der Erfüllung dieser ODE ist notwendiges Kriterium dafür, dass die An-satzfunktion in (3.2) die schwache Formulierung der PDE erfüllt.

3.1.2 Inhomogene Randbedingungen

In den bisherigen Ausführungen wurde angenommen, dass die Randbedingungen der parti-ellen Differentialgleichung homogen sind und die schwache Lösung daher im Raum H1

0 (Ω)zu finden ist. Aufgrund der Homogenität erfüllte dann ebenso der Separationsansatz in (3.2)die Randbedingungen. Im Falle von inhomogenen Randbedingungen ist diese Eigenschaftnicht gegeben. Wäre im Falle der Burgersgleichung etwa v(t, 1) = 1 eine nicht-homogeneDirichlet-Randbedingung, so ergäbe sich aus dem Separationsansatz die algebraische Neben-bedingung

∑i

ai(t)ϕ(1) = 1 ∀t.

Um das exakte Erfüllen der Randbedingung zu gewährleisten ohne das ODE-System mit al-gebraischen Gleichungen zu einem differential-algebraischen System zu erweitern, werden inder Regel zusätzliche Basisfunktionen in den Separationsansatz mitaufgenommen, die dazudienen, die Randbedingungen zu erfüllen [41]. Dieses Verfahren ist analog zur mathematischeTheorie bezüglich der Regelung von PDEs über Randbedingungen und firmiert dort unterdem Schlagwort ’Fattorini-Trick’ [36], [126]. Im oben genannten Beispiel würde der Separa-tionsansatz zu

va(t,x) = x+∑i

ai(t)ϕ(i)(x) , ϕ ∈ H10 (Ω) (3.8)

23

Page 36: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3 Grundlagen der Modellreduktion

erweitert. Die Basisfunktionen ϕ stammen hier nach wie vor aus dem H10 mit homogenen

Randbedingungen, da die Ansatzfunktion va(t,x) − x selbst homogene Randbedingungenhat. Die zusätzliche Basisfunktion x sorgt für eine Homogenisierung der restlichen Basisfunk-tionen. Anstelle der Funktion x kann hier jede Funktion verwendet werden, die die Rand-bedingungen erfüllt und im H1

0 (Ω) lebt. Beliebt sind hier besonders solche Basisfunktionen,die gleichzeitig dazu verwendet werden können, zeitliche Mittelwerte herauszurechnen. DiesesVerfahren wird dann centering trajectory approach genannt [53]. Im Falle zusätzlich auftre-tender zeitvarianter Randbedingungen muss für jede zeitvariante Randbedingung eine zusätz-liche Basisfunktion eingeführt werden. Hierbei wird stets nach einer separierten Darstellunggesucht, um im Galerkin-Modell eine eingangsaffine Struktur zu erhalten. Im konkreten Fallder Burgersgleichung mit den Randbedingungen v(t, 0) = u(t) und v(t, 1) = 1 ergäbe sichder Ansatz

va(t,x) = u(t)(1− x) + x+∑i

ai(t)ϕ(i)(x) , ϕ ∈ H10 (Ω). (3.9)

Nun kann man alle Funktionen zu der Basis ϕ = ϕ ∪ x ∪ (1− x) zusammenfassenund x als das N + 1 und (1−x) als das N + 2 Element der Menge nummerieren. Der Vektora wird dementsprechend zu ae =

[a 1 u(t)

]Terweitert. Da die letzten beiden Elemente

der Basis nicht orthonormal sind, ergibt sich wegen

〈∑i

aiϕ(i),ϕ(k)〉 = ak + 〈aN+1ϕ

(N+1),ϕ(k)〉+ 〈aN+2ϕ(N+2),ϕ(k)〉 (3.10)

für das Galerkin-Modell

a = aeqae + µLae + guaN+1 = 0 (3.11)aN+2 = u

mit den Vektoren, Matrizen und Tensoren

qijk = −〈ϕ(i)(x) · ∂ϕ(j)

∂x(x),ϕ(k)(x)〉L2

Lik = 〈∂2ϕ(i)

∂x2 (x),ϕ(k)(x)〉L2 (3.12)

gi = −〈ϕN+2(x),ϕ(k)(x)〉L2.

Hierdurch wird deutlich, dass im Falle zeitvariabler Randbedingungen u deren zeitliche Ab-leitung u als zusätzliche Eingangsgröße affin in das Galerkin-Modell eingeht. Betrachtet mandas Auftreten von u aus der Warte der mathematischen Theorie und des Fattorini-Tricks,so ist von der Theorie her auch kein besseres Ergebnis zu erwarten, da das Überführen derRandbedingung in das innere des Rechengebietes dort ebenfalls die Differenzierbarkeit derRandbedingung voraussetzt. Aus Sicht der Modellreduktion ist dieser Effekt der fehlenden

24

Page 37: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3.1 Galerkin-Projektion

Orthonormalität der zur Homogenisierung verwendeten Basisfunktion zu den übrigen Ba-sisfunktionen geschuldet. Als Vorteil konnte jedoch die Galerkin-Projektion für Systeme mitnicht-homogenen Randbedingungen auf die Galerkin-Projektion im H1

0 mit homogenen Rand-bedingungen zurückgeführt werden. Für die Anwendung der Galerkin-Projektion auf Systememit inhomogenen Randbedingungen gibt es auch abweichende Ansätze, die allerdings bishernur für lineare Systeme hergeleitet wurden [54].

3.1.3 Approximationsfehler und Genauigkeit

In der bisherigen Darstellung der Galerkin-Projektion mag der Eindruck entstanden sein, dassdas Galerkin-Modell der Form a = f(a) mit den zeitabhängigen Koeffizienten a eine ex-akte Abbildung der partiellen Differentialgleichung als gewöhnliche Differentialgleichung er-laubt. Hier ist zu bemerken, dass die Gleichheit in der gewöhnlichen Differentialgleichung desGalerkin-Modells nur dann erfüllt ist, wenn der Separationsansatz (3.2) auch tatsächlich diepartielle Differentialgleichung löst, da in der Herleitung der Gleichung eben jener Separati-onsansatz anstelle der Lösung v eingesetzt wurde. Werden zu wenig Ansatzfunktionen fürden Separationsansatz gewählt ist der dadurch hervorgerufene Effekt analog zum Abschnei-den von Ansatzfunktionen in (3.11) zu verstehen. Da somit der dynamische Effekt der nichtberücksichtigten Ansatzfunktionen auf die Ableitung der verwendeten ai nicht wiedergegebenwird, erfüllen in diesem Fall die zeitlichen Koeffizienten a nicht die hergeleiteten Gleichungen.Es bleibt jedoch die Tatsache bestehen, dass jede Lösung der partiellen Differentialgleichunggemäß des Separationsansatzes zeitliche Koeffizienten besitzt, die die hergeleiteten gewöhn-lichen Differentialgleichungen notwendig lösen müssen.

Der Approximationscharakter der Galerkin-Projektion wird ebenso deutlich, wenn die Galerkin-Projektion distributiv interpretiert wird. Im Sinne der Distributionen kann die Galerkin-Projektionals Approximation der schwachen Lösung auf dem durch ϕ aufgespannten Unterraum Uϕverstanden werden: Wird die Erfüllung von (3.1) nicht für alle Testfunktionen ϕ ∈ H1

0 (T , Ω),sondern nur für eine ausgewählte Menge von ϕ gefordert, so folgt

〈∂v∂t

+ v∂v

∂x− µ∂

2v

∂x2 ,ϕ(i)〉L2 = 0 für ϕ(i) ∈ H10 (T , Ω). (3.13)

Aufgrund der Linearität des Skalarprodukts gilt diese Gleichung dann ebenfalls für alle Li-nearkombinationen der ϕ(i) und damit für den durch ϕ aufgespannten Unterraum Uϕ.Die Bedingung in (3.13) bedeutet daher, dass nach einer Distribution gesucht wird, die dieschwache Lösung der partiellen Differentialgleichungen im distributionellen Sinne nur auf ei-nem Unterraum exakt erfüllt. Daraus wird klar, dass nicht zu erwarten ist, dass die schwacheFormulierung außerhalb von Uϕ ebenfalls erfüllt wird. Außerhalb des Unterraums Uϕ entstehtdaher ein Residuum. Innerhalb des Unterraums jedoch ist der Separationsansatz gültig unddas Residuum verschwindet. Verfahren, bei denen die Ansatzfunktion die Randbedingungenimmer exakt erfüllt, während die schwache Formulierung nicht überall exakt erfüllt wird, wer-den auch innere Verfahren genannt [37]. Die Galerkin-Projektion ist dasjenige Verfahren, bei

25

Page 38: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3 Grundlagen der Modellreduktion

dem das Residuum auf demselben Unterraum verschwindet, der zur Konstruktion der Ansatz-funktion gewählt wurde.

Aus der Herleitung der ODE wird klar, dass bei der Verwendung von N Basisfunktionen fürden Separationsansatz die Dimension der ODE und des Unterraums, auf dem das Residuumverschwindet, ebenfalls N ist. Im Bezug auf das Ziel der Modellreduktion, möglichst wenigeZustände im reduzierten Modell zu verwenden, kann im Allgemeinen nicht davon ausgegan-gen werden, dass N so hoch gewählt werden kann, dass die Funktion der Separationsansatzdie PDE erfüllt. Das bedeutet, dass für die Modellreduktion die Galerkin-Projektion als Ap-proximation verstanden werden muss. Dabei gibt es ohne zusätzliche Annahmen bezüglichder partiellen Differentialgleichung keine günstigen Abschätzungen des Approximationsfehlers(siehe dazu auch [53]). In der praktischen Anwendung im Umfeld technischer Systeme wirddie Galerkin-Projektion dennoch oft angewandt, da durch den dämpfenden Charakter realauftretender Reibungs- und Verlustterme die systemdynamisch wichtigen Einflüsse einem Un-terraum geringer Dimension zugeordnet werden können. Dieser Punkt wird in 3.2.5 wiederaufgegriffen und genauer ausgeführt.

Ein weiterer Aspekt des Galerkin-Modells ist die numerische Genauigkeit im Falle einer realenImplementierung. Hier lässt sich für die bisherigen Gleichungen in (3.12) eine wesentliche Ver-besserung einführen. In der bisherigen Form verlangt die Berechnung von (3.12) das Auswertender zweiten Ableitungen von ϕ. Die Berechnung dieser höheren Ableitung kann vermiedenwerden, indem der Satz von Gauß herangezogen wird. Hierdurch ergibt sich

〈∂2ϕ(i)

∂x2 (x),ϕ(k)(x)〉L2 =[∂ϕ(i)

∂x·ϕ(k)

]Ω− 〈∂ϕ

(i)

∂x, ∂ϕ

(k)

∂x〉L2, (3.14)

wodurch nur noch die Berechnung der ersten Ableitung von ϕ notwendig wird. Da das Ab-leiten von Funktionen in der numerischen Umsetzung oft schlecht konditioniert ist, lässt sichhierdurch die numerischen Genauigkeit in der Aufstellung des Galerkin-Modells verbessern.

Auch wenn die exemplarische Herleitung für Burgersgleichung für skalare Funktionen auf ein-dimensionalen Gebieten x ∈ R vorgenommen wurde, so kann diese ohne weiteres durch diekomponentenweise Anwendung und die passenden Skalarprodukte auch auch vektorvertigeFunktionen auf mehrdimensionalen Gebieten übertragen werden.

3.2 Proper Orthogonal Decomposition

Mit der Galerkin-Projektion aus Kapitel 3.1 steht ein Werkzeug zur Verfügung, mit welchemeine partielle Differentialgleichung in eine gewöhnliche Differentialgleichung umgewandelt wer-den kann. Hierbei ist zu rekapitulieren, dass die Dimension des Zustandsraums der gewöhnli-

26

Page 39: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3.2 Proper Orthogonal Decomposition

che Differentialgleichung der Anzahl der verwendeten Basisfunktionen im SeparationsansatzN entspricht. Für eine exakte Lösung der PDE muss meist N → ∞ gewählt werden, wo-durch die Verwendung der ODE-Modelle im Reglerentwurf unpraktikabel wird. Deswegen istes notwendig, eine endliche Anzahl an Basisfunktionen zu wählen und dabei entstehende Feh-ler durch die näherungsweise Lösung der PDE in Kauf zu nehmen. Finite-Elemente Verfahrenverwenden hier Basisfunktionen, die nur auf einem kleinen Gebiet wie beispielsweise einemDreieck verschieden von Null sind. Dabei entstehen hochdimensionale ODEs mit dünnbeset-zen Matrizen. Damit sind diese Verfahren durch ihre universellen Basisfunktionen und dievorteilhafte numerische Struktur der ODE-Modelle gut dazu geeignet, unbekannte Lösungenfür PDEs zu ermitteln. Die Anzahl der zu verwendenden Zustände ist allerdings sehr hoch. ImRahmen des Zielkonflikts zwischen Modellkomplexität und Modellgenauigkeit stellt sich daherdie Frage, wie eine optimale Bestimmungsmethode für die Basisfunktionen ϕ aussähe, um miteiner möglichst geringen Anzahl an Basisfunktionen eine möglichst hohe Modellgenauigkeit zuerreichen. Dabei kommen universell einsetzbare Basisfunktionen, wie die der Finiten-ElementeVerfahren, nicht in Betracht, sondern es werden stattdessen globale Basisfunktionen unter-sucht, die problemspezifisch auf die Reproduktion von mit dem Finiten-Elemente Verfahrenberechneten Lösungen zugeschnitten sind. Der Frage nach der optimalen Reproduktion vonLösungen widmet sich die Proper Orthogonal Decomposition, deren Darstellung sich – analogzur Galerkin-Projektion – an [23], [24], [53] und [76] orientiert. Zu den verwendeten funktio-nalanalytischen Grundlagen über selbstadjungierte kompakte Operatoren und ihr Spektrumsei auf [124] verwiesen.

3.2.1 Optimale Basisfunktionen

Das Ziel der POD ist es, orthonormale Basisfunktionen ϕ(x) zu finden, die eine gegebenePDE-Lösung v(t,x) optimal reproduzieren. Im Sinne der POD ist dabei eine Basisfunktionoptimal, wenn die Projektion der PDE-Lösung auf diese Basisfunktion maximal wird. Dadie Projektion für jeden Zeitpunkt t unterschiedlich ist, wird gefordert, dass der zeitlicheMittelwert der Projektion maximiert wird.

Definition 5 Die Abbildung [·]T : L2 → R heißt Mittelwertbildung, sofern [·]T stetig undlinear ist und mit dem Skalarprodukt 〈·, ·〉L2 kommutiert.

Eine Mittelwertbildung bildet also eine integrierbare Funktion stetig und linear auf reelleZahlen ab. Zu beachten ist, dass bei allen Funktionen f aus den eingeführten Bochner-Räumen sich ‖f(t, ·)‖2 im L2 befindet und die Mittelwertbildung auf diese daher angewandtwerden kann. Auf Basis der Mittelwertbildung [·]T lässt sich der Begriff der Optimalität imPOD-Sinne definieren.

Definition 6 Sei v(t,x) ∈ H1(T , Ω)d und Ω kompakt. Eine Basisfunktion ϕ ∈ H1(Ω)dheißt optimal, wenn [〈v,ϕ〉2L2]T = max

‖ψ‖L2=1[〈v,ψ〉2L2]T gilt.

27

Page 40: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3 Grundlagen der Modellreduktion

In Definition 6 wurden die Skalarprodukte des L2 verwendet, während die Funktionen sel-ber aus dem H1 stammen. Wegen Hk ⊂ L2 ist dies jedoch wohldefiniert. Die Forderung‖ψ‖L2 = 1 unterstützt die Eindeutigkeit der Lösung. Weiter ist zu beachten, dass die Opti-malität von der betrachteten PDE-Lösung v abhängig ist und zunächst nur die Optimalitäteiner einzigen Basisfunktion beschreiben ist. Eine optimale orthonormale Basis lässt sich abereinfach dadurch konstruieren, dass das Optimierungsproblem mehrfach hintereinander gelöstwird, wobei die Projektionen der bereits als optimal bestimmten Basisfunktionen von v subtra-hiert werden. Das bedeutet, dass für die n-te Basisfunktion die modifizierte Lösung vn(t,x)mit

vn(t,x) = v(t,x)−n−1∑i=1〈v(t,x),ϕ(x)〉L2 (3.15)

für das Optimierungsproblem verwendet wird. Die Suche nach der optimalen Basisfunktionlässt sich als Maximierungsproblem eines linearen OperatorsR schreiben. Dazu wird als erstesdie Optimalitätsbedingung aus Definition 6 als

[〈v,ϕ〉2L2

]T

=

∫Ω

ϕ(x)v(t,x) dx∫Ω

ϕ(x)v(t, x) dx

T

(3.16)

ausgeschrieben. Da nur die Ausdrücke in v von der Zeit abhängen und die Mittelwertbildungmit dem Skalarprodukt kommutiert, folgt weiter

∫Ω

ϕv dx∫Ω

ϕv dx

T

=∫Ω

ϕ(x)∫Ω

[v(t,x)v(t, x)]T ϕ(x) dx dx. (3.17)

Unter Einführung des Operators R als

Definition 7 R : H1(Ω)d → H1(Ω)d mit (Rϕ)(x) =∫Ω

[v(t,x)v(t, x)]T ϕ(x) dx

entspricht die Suche nach der Optimalität der Basisfunktion der Maximierung vonR gemäß

max‖ψ‖L2=1

[〈v,ψ〉2L2

]T

= max‖ψ‖L2=1

〈ψ,Rψ〉L2. (3.18)

Der Operator R wird dabei auch als Korrelationsoperator bezeichnet, da der Integralkernaus der zeitlich korrelierten Mittel der Lösungsfunktion gebildet wird. Bezüglich der Maximie-rung von Operatorgleichungen wie (3.18) gibt es eine ausgebaute mathematische Theorie,sofern der Operator linear, selbstadjungiert und kompakt ist, da diese Operatoren ein reellesSpektrum mit einem eindeutigen Maximum besitzen [124].

28

Page 41: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3.2 Proper Orthogonal Decomposition

Der Operator R ist offensichtlich linear und ebenfalls selbstadjungiert wegen

〈ψ,Rϕ〉L2 =∫Ω

ψ(x)∫Ω

[v(t,x)v(t, x)]T ϕ(x) dx dx

S.v.F .=∫Ω

ϕ(x)∫Ω

[v(t, x)v(t,x)]T ψ(x) dx dx (3.19)

= 〈Rψ,ϕ〉L2,(3.20)

wobei der Satz von Fubini verwendet wurde und die Integrationsgebiete wechselseitig umbe-nannt wurden. Der Satz von Fubini ist hier anwendbar, da das zugehörige Integral durch dieDefinition von R nach Voraussetzung existiert. Der Operator ist ebenfalls kompakt, da fürIntegral-Operatoren in der Form von R der folgende Satz gilt:

Satz 2 Der Operator Rx(s) =∫Ωk(s, t)x(t) dt ist kompakt, sofern Ω kompakt ist und für

k ∈ L2 fast überall k(s, t) = k(t, s) gilt.

Für k(x, x) = [v(t,x)v(t, x)]T sind die Bedingungen aus Satz offensichtlich erfüllt. Dahererfüllt R alle drei Voraussetzungen und hat somit reelle Eigenwerte λ, die alle nicht-negativsind und für die

λ1 ≥ λ2 ≥ · · · ≥ 0 (3.21)

gilt. Das Spektrum von R besteht also nur aus Eigenwerten und eventuell einem Häufungs-punkt in Null. Damit ist aber die Lösung des Maximierungsproblems (3.18) bereits ermittelt:Da der Raum H1(Ω)d ein separabler Hilbertraum ist, können wir jeden Lösungskandidatenals abzählbare Summe orthogonaler Basisfunktionen des H1(Ω)d schreiben. Daraus ist sofortersichtlich, dass jedes ϕ ∈ H1(Ω) Gleichung (3.18) löst, für welches Rϕ = λ1ϕ gilt. Alleweiteren Basisfunktionen ergeben sich dann als die Eigenfunktionen zu den weiteren Eigen-werten λ2,λ3, . . . . Aufgrund der Maximierungsaufgabe spielt der möglicherweise auftretendenHäufungspunkt des Spektrums in Null keine Rolle. Die optimale Basis im POD-Sinne wirddaher aus den Eigenfunktionen ϕ, die zu den größten Eigenwerten λ des Operators R gehö-ren, gebildet. Da die optimalen Basisfunktionen mathematisch gesehen Eigenfunktionen sind,werden sie auch als Moden bezeichnet. Aufgrund von (3.21) sind die Moden über die zuge-hörigen Eigenwerte zudem sortiert, was es möglich macht, die Basisfunktionen in wichtigerAnteile (das heißt: größere Eigenwerte) und weniger wichtige Anteile (kleinere Eigenwerte)zu unterteilen. Im Zuge der Modellreduktion wählt man nun die ersten N N Basisfunk-tionen aus, um ein Modell mit nur N Zuständen zu erhalten, welches dennoch optimal vieleInformationen beinhaltet. Die Schreibweise N meint, dass es sich hierbei um eine hohe Zahlvon Basisfunktionen handelt, während N eine reduzierte, geringere Anzahl an Basisfunktionenanzeigt. Auf die Wahl von N – die durch die Tatsache, dass die Moden durch die Eigenwertesortiert sind, vereinfacht wird – wird im Abschnitt 3.2.5 eingegangen.

29

Page 42: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3 Grundlagen der Modellreduktion

3.2.2 Optimale Koeffizienten

Die Eigenschaften des Operators R lassen sich zusätzlich dergestalt ausnutzen, dass dasMaximierungsproblem nicht nur für die Basisfunktionen ϕ(i), sondern auch für die zugehörigenzeitabhängigen Koeffizienten ai(t) formuliert werden kann. Die Darstellung von ai durch ϕ(i)

ist durch den Separationsansatz als

v(t,x) =∞∑i=1

ai(t)ϕ(i)(x) =∞∑i=1〈v(t,x),ϕ(i)(x)〉L2 ϕ

(i)(x) (3.22)

gegeben. Diese Reihe konvergiert aufgrund des separablen Hilbertraums und der Linearität undKompaktheit von R gleichmäßig bezüglich der L2-Norm und darf daher in ihrer Reihenfolgemit Integralen vertauscht werden. Mit dieser Eigenschaft erkennt man, dass wegen

λkϕ(k)(x) = Rϕ(k)(x) =

∫Ω

[v(t,x)v(t, x)]T ϕ(k)(x) dx

=∫Ω

∞∑i=1

ai(t)ϕ(i)(x)∞∑j=1

aj(t)ϕ(j)(x))T

ϕ(k)(x) dx (3.23)

=∞∑i=1ϕ(i)(x) [ai(t)ak(t)]T

die zeitlichen Koeffizienten im zeitlichen Mittel unkorreliert sind, das heißt es gilt

[ai(t)aj(t)]T =

λi wenn i = j

0 sonst. (3.24)

Damit nimmt der zeitliche Mittelwert [·]T für die Koeffizienten eine vergleichbare Rolle ein,wie das Skalarprodukt für die Basisfunktionen: Die Koeffizienten sind bezüglich des zeitlichenMittelwertes orthogonal zueinander. Aufgrund dieser Eigenschaft lässt sich Darstellung vonai durch ϕ(i) in (3.22) in die Darstellung von ϕ(i) durch ai

ϕ(i)(x) = 1λi

[ai(t)v(t,x)]T (3.25)

umkehren. Da sich ϕ(i) und ai wechselseitig darstellen lassen, kann das Maximierungspro-blem für die Basisfunktionen auch als Maximierungsproblem für die zeitlichen Koeffizientenumformuliert werden. Durch das Einsetzen von (3.22) und (3.25) in (3.18) ergibt sich nacheinigen elementaren Umformungen

λkak(t) =[〈v(t,x),v(t,x)〉L2 ak(t)

]T

. (3.26)

30

Page 43: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3.2 Proper Orthogonal Decomposition

Im Vergleich zur Definition des Operators R in Definition 7 sieht man, dass die Rollen desSkalarprodukts und der Mittelwertbildung erneut vertauscht worden sind. Daher ist es sinnvoll,den Operator R zu definieren:

Definition 8 R : H1(T )→ H1(T ) mit (Ra)(t) =[∫

Ωv(t,x)v(t,x) dx a(t)

]T

Dieser Operator wird im Folgenden auch als adjungierter Operator bezeichnet. Das Spektrumvon R und R ist gemäß der Herleitung für alle Eigenwerte (das heißt ausgenommen denmöglichen Häufungspunkt in Null) identisch. Im Falle der POD ist es für die Bestimmung deroptimalen Moden also sowohl möglich, die Eigenfunktionen zu den größten Eigenwerten vonR zu berechnen, als auch die Eigenfunktionen zu den größten Eigenwerten von R auf v(t,x)zu projizieren.

Ein zusätzlicher wichtiger Punkt, der mit (3.25) zusammenhängt, ist die Tatsache, dass sichEigenschaften der Lösung v auf die Basisfunktionen ϕ übertragen. Wie in (3.25) darge-stellt, bilden sich die Basisfunktionen als zeitliche Linearkombination der Lösung v, da dieMittelwertbildung linear ist. Damit erben die Basisfunktionen jedoch alle Eigenschaften derLösung v, sofern diese Eigenschaften linear in der Zeit sind. Dazu gehört die Homogenität derRandbedingungen, die bereits im Zusammenhang von (3.11) diskutiert wurde. Dort wurdegefordert, dass alle Basisfunktionen (bis auf die zusätzlichen Moden, die die Randbedingun-gen erfüllen) homogene Randbedingungen aufweisen müssen. Durch (3.25) wird klar, dassdie für ein Strömungsfeld mit homogenen Randbedingungen berechneten Basisfunktionenhomogenen Randbedingungen haben. Daher werden in der Berechnung der Moden gemäß(3.15) zuerst die homogenisierenden Basisfunktionen von der Lösung der PDE subtrahiertund so die Lösung homogenisiert. Damit liegt die modifizierte Lösung v im H1

0 (Ω) statt imH1(Ω) und die Randbedingungen aller weiteren Basisfunktionen sind homogen. Ein weitereEigenschaft, die sich von den Lösung der PDE auf die Basisfunktionen durch (3.25) über-trägt ist die Divergenzfreiheit im Falle der Navier-Stokes-Gleichungen (siehe dazu auch [53]).Dies gilt natürlich nur, wenn auch die homogenisierenden zusätzlichen Basisfunktionen selbstdivergenzfrei sind. Damit ist es für ein reduziertes Modell der Navier-Stokes-Gleichungen,dass über ein Verfahren, welches (3.25) beinhaltet, berechnet wurde, nicht notwendig, dieForderung nach Divergenzfreiheit mitaufzunehmen.

3.2.3 Diskretisierte Implementierung

Für eine numerische Bestimmung der Moden ist davon auszugehen, dass die Lösungen v(t,x)des zu reduzierenden Systems nicht als analytische Funktionen mit einer kontinuierlichen Orts-und Zeitkoordinate gegeben sind, sondern vielmehr als orts- und zeitdiskretisierte Matrix vor-liegen. Geht man zunächst von dem Spezialfall einer skalaren Lösungsfunktion v(t,x) aus, diemit Nt Stützpunkten ti in der Zeit und Nx Stützpunkten xi im Ort diskretisiert ist, so ergibtsich die zugehörige Datenmatrix V zu Vij = v(ti,xj) und liegt damit als Nt × Nx-Matrix

31

Page 44: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3 Grundlagen der Modellreduktion

vor. Die transponierten Zeilen von V werden auch als Snapshots vj = v(tj,x)T bezeich-net, da es sich um Aufnahmen der Lösung zu einem Zeitpunkt handelt. Die Datenmatrix Vwird in diesem Zusammenhang auch als ’Snapshot-Daten’ bezeichnet. Da für eine adäquateWiedergabe der kontinuierlichen Lösung die Orts- und Zeitdiskretisierung oftmals sehr feingewählt werden müssen, zeigt die Verwendung der kalligraphischen Symbole Nt und Nx, dasses sich hierbei um hohe Zahlenwerte handeln kann. Aus den einzelnen Moden ϕ(x) und Ko-effizienten a(t) werden diskretisierte Spaltenvektoren Φ mit Nx und A mit Nt Einträgen. Diegesamte Basis ergibt sich dann als Matrix Φ ∈ RNx×N und die gesamten Koeffizienten alsA ∈ RNt×N . Zu beachten ist, dass es sich für die Implementierung in der Praxis bei V umdie homogenisierten Datensätze handeln wird, von denen die zusätzlichen Basisfunktionen,die zur Erfüllung der Randbedingungen notwendig sind, bereits abgezogen wurden.

Durch die Diskretisierung müssen neben den Funktionen und Moden auch die Mittelwertbil-dung [·] und das Skalarprodukt 〈·, ·〉L2 durch diskretisierte Pendants ersetzt werden. Dabeibieten sich das Standard-Skalarprodukt und die Standard-Mittelwertbildung

1Nx

ΦTΦ beziehungsweise 1NtATA, (3.27)

an, welche bis auf die Normierung mit 1Nx beziehungsweise 1

Nt dem gängigen Skalarproduktim RNx und RNt entsprechen. Die Normierung stellt dabei eine annehmbare Approximationdes Mittelwertes und des Integrals sicher. Es ist aber natürlich dennoch möglich, um denDiskretisierungsfehler für das Integral und den zeitlichen Mittelwert zu reduzieren, andereSkalarprodukte 〈·, ·〉Nx und Mittelwerte [·]N t zu verwenden. Je nach Wahl des Skalarproduktsund des Mittelwerts ergeben sich die Operatoren R und R zu Matrizen R ∈ RNx×Nx undR ∈ RNt×Nt , die direkt von V abhängig sind. Für das Standard-Skalarprodukt ergibt sich

Rij = 1Nx

[V (:,xi) · V (:,xj)]N t (3.28)

und für den Standard-Mittelwert

Rij = 1Nt〈V (ti, :),V (tj, :)〉Nx. (3.29)

Verwendet man sowohl das Standard-Skalarprodukt als auch den Standard-Mittelwert erhältman

R = 1NxNt

V TV und R = 1NxNt

V V T (3.30)

Analog zur vorherigen Betrachtung des Operatorspektrums wird aus (3.30) klar, dass R undR außer zusätzlichen Eigenwerten bei Null die gleichen Eigenwerte besitzen. Außerdem zeigt(3.30) die Verbindung der POD zur Singulärwertzerlegung auf. Da alle λ – abzüglich desSkalierungsfaktors 1

NtNx – die Eigenwerte von V TV sind, handelt es sich hierbei um die Sin-gulärwerte der Datenmatrix V [20]. Die Basisfunktionen und Koeffizienten können analog zur

32

Page 45: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3.2 Proper Orthogonal Decomposition

Singulärwertzerlegung als Rechts- beziehungsweise Links-Singulärvektoren verstanden werden.

Aus der aufgezeigten Verbindung der POD mit der Singulärwertzerlegung werden zwei weiterePunkte deutlich: Erstens entspricht die Beschränkung auf einige wenige Singulärwerte und diezugehörigen Singulärvektoren dem Verfahren der Hauptkomponentenanalyse beziehungsweiseHauptachsentransformation, die auf Englisch auch Principle Component Analysis (PCA) ge-nannt wird. Dieses Verfahren der multivariaten Statistik dient dazu, große Datensätze dadurchzu strukturieren, dass die statistischen Variablen durch die Linearkombination der sogenann-ten Hauptkomponenten (welche den Basisfunktionen entsprechen) angenähert werden. Damitentspricht die Proper Orthogonal Decomposition in ihrer diskretisierten Implementierung derPCA. Das Homogenisieren der Daten über den centering trajectory approach ist dann ana-log zum beliebten Herausrechnen von Mittelwerten vor Durchführen einer PCA zu sehen. Esist aber zusätzlich zu bemerken, dass durch die Herleitung der POD deren Optimalität –im Gegensatz zur Optimalität der PCA – auch für den kontinuierlichen, nicht-diskretisiertenFall gegeben ist, was das Vorgehen bei der Anwendung auf partiellen Differentialgleichungenzusätzlich rechtfertigt. Weiterhin wird die Bezeichnung von R als Korrelationsoperator klar,da es sich bei V TV und V V T um die zu V gehörigen Korrelationsmatrizen handelt. Dasbedeutet, dass die POD unter zwei äquivalenten Gesichtspunkten betrachtet werden kann:als das Finden der optimalen Basisfunktionen über eine Optimierung und gleichzeitig als Kor-relationsanalyse der Snapshot-Daten.

Zweitens gibt es für die POD eine ökonomische Variante. Insbesondere im Falle von Strö-mungssimulationen werden meistens mehr Gitterpunkte im Ort als Diskretisierungspunkte inder Zeit verwendet, weshalb in der Regel Nx Nt gilt. In diesem Fall führt die Singulärwert-zerlegung von V entweder auf das Berechnen von Eigenwerten einer Nx × Nx-Matrix (wasder Analyse von R entspräche), oder von Eigenwerten einer Nt × Nt-Matrix (was R ent-spricht). Aus numerischer Sicht ist es hier offensichtlich effizienter, die Singulärwertzerlegungso durchzuführen, dass die Matrix geringerer Dimension verwendet wird, um das unnötigenBerechnen von Nx−Nt Eigenwerten, die allesamt identisch Null sind, und Eigenvektoren zuvermeiden. Übertragen auf die POD ist dort die Verwendung von R und damit das Bestim-men der Koeffizienten anstatt der Basisfunktionen zu bevorzugen. Im Zusammenhang mit derPOD wurde dieses Verfahren erstmals von Sirovich [110] eingeführt und auf dessen Arbeitzurückgehend als Method of Snapshots bezeichnet. Im Zusammenhang mit Strömungsprozes-sen werden hier Lösungen zu diskreten Zeitpunkten über (3.29) zur AutokorrelationsmatrixR verrechnet. Als Skalarprodukt wird das klassische L2-Skalarprodukt verwendet.

Dieses Vorgehen hat neben der reduzierten Rechenzeit durch die Nt × Nt-Matrix den wei-teren Vorteil der verbesserten Wahl des Skalarproduktes. Ohne Verwendung der Method ofSnapshots muss für das Skalarprodukt das Standard-Skalarprodukt gewählt werden, um eineentsprechende Matrixmultiplikation zu erhalten. Dadurch ist das Skalarprodukt ein schlech-tere Approximation des L2-Skalarprodukts, insbesondere deshalb, weil das Orts-Rechengebietim Gegensatz zur Zeitkoordinate mehrdimensional ist. Ebenso ist damit das Skalarproduktder POD nicht konsistent zum Skalarprodukt der Galerkin-Projektion gewählt. Zwar lässt sich

33

Page 46: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3 Grundlagen der Modellreduktion

die Herleitung der Galerkin-Projektion auch für andere Skalarprodukte vornehmen, allerdingsgehen dann gewünschte Eigenschafte, wie beispielsweise das Vermeiden der zweiten partiellenAbleitungen durch Verwendung des Satzes von Gauß in (3.14) verloren.

3.2.4 Mehrdimensionalität

Ein weiterer offener Punkt, der mit der Wahl des Skalarproduktes zusammenhängt, ist derUmgang mit mehrdimensionalen partiellen Differentialgleichungen und Datensätzen. DieseKlasse von PDEs tritt bei Strömungsprozessen regelmäßig auf, sobald die Strömung nichteindimensional modelliert werden kann. So sind die Navier-Stokes-Gleichungen sogar nur inzwei oder drei Dimensionen sinnvoll. Das Problem verschärft sich im Falle kompressibler Strö-mungen, da dort nicht nur die Strömungsgeschwindigkeit, sondern auch der Druck und dieDichte bilanziert werden müssen [86]. Die bisherigen Herleitungen decken den Fall mehrdi-mensionaler PDEs oder von PDEs, die von verschiedenen physikalischen Größen abhängen,nicht ab. Für die Behandlung derartiger Gleichungen gibt es grundsätzlich zwei Möglichkeiten(siehe beispielsweise [10] oder [60]):

Die eine Möglichkeit besteht darin, das System partieller Differentialgleichungen als eine vek-torwertige PDE aufzufassen. In diesem Fall wird ein Satz von Basisfunktionen berechnet,der ebenso vektorwertig wie die PDE die verschiedenen physikalischen Größen enthält. Kon-kret werden hierzu die verschiedenen Dimensionen in v in den Snaphsots V (ti, :) , die dieDatenmatrix V bilden, untereinander angeordnet. Dies entspricht bei v ∈ Rd rechenzeit-technisch einer Vergrößerung des örtlichen Rechengebietes um den Faktor d. Für das Ska-larprodukt bedeutet dies eine Summation der Skalarprodukte der einzelnen Dimensionen vi.Daraus wird ebenso klar, dass die Basisfunktionen bezüglich der einzelnen Dimensionen nichtorthogonal zueinander stehen, sondern erst in ihrer vektorwertigen Zusammensetzung die Or-thogonalitätsbedingung erfüllen. Zudem ist zu beachten, dass alle auftretende Dimensionenoder physikalischen Größen auf dieselbe Größenordnung skaliert werden müssen, da ansons-ten die Informationen durch die Konstruktion des Skalarproduktes für die Optimierung derPOD unterschiedlich gewichtet werden könnten [86]. Trotz der notwendigen Skalierung undden Einschränkungen in der Bedeutungskraft des Skalarproduktes hat diese Methode dengewichtigen Vorteil, dass nur ein Satz von Basisfunktionen berechnet werden muss.

Die zweite Möglichkeit für die Berechnung der Moden ist es, eine sogenannte physikalisch mo-tivierte Modellreduktion [10] vorzunehmen. Hier werden für alle physikalischen Größen oderDimensionen getrennt separate Modensätze berechnet. Daher ist mit dem Begriff der physi-kalisch motivierten Modellreduktion keine physikalisch inspirierte Wahl der Moden gemeint,sondern vielmehr dass unterschiedliche physikalische Größen auch unabhängig voneinanderstatistisch analysiert werden sollten. Durch die separaten Modensätze steigt der Rechenauf-wand im Vergleich zu ersten Variante: Auch wenn das örtliche Rechengebiet nicht vergrößertwird, so muss die Berechnung der POD mehrfach durchgeführt werden. Bei Verwendung derMethod of Snapshots überwiegt hier bezüglich der Rechenzeit stark das mehrfache Berech-nen der POD. Für diesen Rechenzeiteinsatz gewinnt man allerdings den Vorteil, dass die

34

Page 47: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3.2 Proper Orthogonal Decomposition

Struktur der PDE in die reduzierten Modelle mit übernommen werden kann. Zudem hat dasSkalarprodukt, da das Verwenden einer Skalarproduktsumme nicht notwendig ist, eine direk-tere physikalische Bedeutung. Zu guter Letzt ermöglicht die getrennte statistischen Analyseauch eine unterschiedliche Anzahl an Basisfunktionen für die verschiedenen Dimensionen oderphysikalischen Größen. Dies kann insbesondere dann interessant werden, wenn die komple-xe Dynamik des Systems klar einer bestimmten Dimension oder Größe zugeordnet werdenkann.

3.2.5 Auswahl der Moden

Im vorherigen Abschnitt wurde bei der Diskussion der Mehrdimensionalität bereits die Fragenach der Anzahl der zu verwendenden Moden aufgeworfen. Hier ist als erstes – anknüpfend andie Ausführung in 3.1.3 – festzustellen, dass eine Verwendung einer geringen Modenanzahl alsder, welche für die exakte Lösung des Separationsansatzes notwendig ist, notwendigerweise zuFehlern führen muss. So ergibt sich beispielsweise der stationäre Fall des reduzierten Modellsfür den Koeffizienten a1 der Burgersgleichung in (3.6) mit ausgeschriebenen Vektoren zu

a1 =

a1...aNaN+1...

T

q1

a1...aNaN+1...

+ µL1

a1...aNaN+1...

!= 0. (3.31)

Aus (3.31) wird klar, dass ein Abschneiden der Moden nach N verwendeten Koeffizienten imAllgemeinen einen anderen stationären Punkt liefern wird, als die Verwendung der vollständi-gen Funktionenbasis. Diese Aussage gilt natürlich nicht nur für den stationären Fall, sondernfür das reduzierte Modell als solches. Gleichung (3.31) zeigt aber auch direkt auf, welchesVerhalten die Koeffizienten und Moden besitzen sollten, damit der so entstehenden Fehlernicht zu groß wird. Aus der Konvergenz der Fourierreihen ist das mathematische Resultatbekannt, dass der Betrag der Fourierkoeffizienten mit 1

|k|n abfällt, wenn die als Fourierreiheentwickelte Funktion f ∈ Cn liegt, das heißt n-mal stetig differenzierbar ist. Hier bezeichnetk den Index der Fourierkoeffizienten. Das bedeutet, dass die Koeffizienten der Fourierreihe einstark abklingendes Verhalten besitzen, sofern die entwickelte Funktion glatt ist. Übertragenauf die Galerkin-Projektion bedeutet dies, dass die Annahme, dass die Koeffizienten ai(t) inihrer Amplitude ebenfalls ein abklingendes Verhalten mit i besitzen, nicht ganz ungerechtfer-tigt ist. Gleichzeitig werden auch die Elemente von q und L nicht unverhältnismäßig steigen,da die zur Berechnung verwendeten Basisfunktionen ϕ und deren Ableitungen wegen ϕ ∈ H1

0stetig und beschränkt sind. Klingen jedoch die Koeffizienten stark ab, während q und L sehrviel weniger stark anwachsen, so wird der Fehler, der durch das Verwenden von nur N Basis-funktionen entsteht, schnell klein.

35

Page 48: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3 Grundlagen der Modellreduktion

Das angesprochene Abklingverhalten kann in der Praxis zum Beispiel bei den Navier-Stokes-Gleichungen oder der Burgersgleichung regelmäßig beobachtet werden, sofern die Viskositätµ nicht zu klein wird. Dies kann so verstanden werden, dass durch die Viskosität Reibungund damit Dämpfung in das System miteingebracht wird. Diese Reibung glättet dabei dieLösungsfunktionen, wodurch – in Analogie zur Regularität der Funktion in der Fourierreihen-entwicklung – die Koeffizienten stärker abfallen. Für eine reine Transportgleichung mit µ = 0ist das Verfahren hingegen nicht sinnvoll anwendbar, da in diesem Fall sogar unstetige Lösun-gen (vergleiche beispielsweise das Totzeit-Element der klassischen Systemtheorie) auftretenkönnen und ein Abfallen der Koeffizienten nicht beobachtet werden kann.

Die obige Argumentation ist wenig formal, sondern basiert vielmehr auf Analogien der zeitli-chen Koeffizienten zu den Fourierkoeffizienten. Eine ähnliche Begründung lässt sich nicht nurauf Basis der Galerkin-Projektion, sondern auch der POD finden. Hier kann der Approxima-tionsfehler der POD-Approximation gegenüber der Datenmatrix V , die zur Berechnung derPOD-Moden verwendet wurde, angegeben werden. Unter Ausnutzung der Analogie der PODim diskreten Fall zur Singulärwertzerlegung lässt sich der relative Informationsgehalt (relativeinformation content, RIC)

RIC(N) =

N∑i=1

λi

Nt∑i=1

λi

(3.32)

definieren [23], [64]. Aufgrund der Sortierung der Eigenwerte nach ihrer Größe, wobei dernächste Eigenwert nie größer als jeder vorherige ist, handelt es sich beim RIC um eine konkaveFunktion über N . Der RIC kann dabei im Falle der Modellreduktion von Strömungsgeschwin-digkeiten gemäß [64], [110] als Anteil der im reduzierten Modell abgebildeten kinetischenEnergie interpretiert werden. Zu beachten ist hierbei, dass der RIC nur für den endlichdi-mensionalen Fall und damit für die diskretisierte Datenmatrix Gültigkeit hat. Außerdem gilt(3.32) nur für die Daten, die zur Berechnung der POD herangezogen wurden. Auf andereLösungsverläufe wie zum Beispiel Validierungsdaten kann die Abschätzung nicht verallgemei-nert werden. Zu guter Letzt bezieht sich die Abschätzung nur auf die Wiedergabe der Daten.Aufgrund der bereits ausgeführten Einflüsse einer unvollständigen Basis kann hieraus keineFehlerabschätzung für das aus Galerkin-Projektion und POD zusammengesetzte reduzierteModell abgeleitet werden.

Die aufgeführte Abschätzung für die Genauigkeit der POD in (3.32) und die Argumentationbezüglich des eingeschränkten Fehlers bei unvollständiger Basis bei der Galerkin-Projektionsind keine rigorosen Formalismen sondern lediglich Heuristiken. Die Verwendung dieser Erfah-rungswerte ist auch deshalb notwendig, weil es für den nichtlinearen Fall keine allgemeinenFehlerabschätzungen gibt, die die Abweichung zwischen dem reduzierten Modell und der PDEbeschreiben. Von mathematischer Seite her gibt es zwar Abschätzungen, die aber weniger fürdie konkrete Spezifizierung des Fehlers in seiner Größenordnung zu nutzen sind, sondern

36

Page 49: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

3.2 Proper Orthogonal Decomposition

vielmehr für Konvergenzeigenschaften. So wird beispielsweise in [65] gezeigt, dass der POD-Approximationsfehler verschwindet, wenn das über die Galerkin-Methode ermittelte ROM miteinem impliziten Euler gelöst wird, sofern die Schrittweite gegen Null geht, der RIC gegen100% und der Anfangszustand korrekt im ROM abgebildet wird. Eine konkrete Ableitung derGrößenordnung des Fehlers, sofern diese Bedingungen nicht erfüllt sind, lässt sich allerdingsnicht vornehmen. In der Praxis wird daher meist der relative Informationsgehalt verwendetund darauf geachtet, dass die Dämpfung beziehungsweise Viskosität des betrachteten Sys-tems hinreichend hoch ist. Aufgrund der Tatsache, dass der RIC nur für die Datenmatrixeine gültige Abschätzung liefert, ist die Auswahl der Daten, welche für die Berechnung derBasisfunktionen genutzt werden, von entscheidender Bedeutung. Die Datenmatrix muss hiermöglichst die gesamte dynamische Bandbreite des Systems abbilden [45]. Bei Verwendungeiner Regelung muss dies für die Dynamik des geregelten Systems gelten. Das bedeutet,dass sich die Aktuierung u idealerweise Verläufe zeigt, die denen im geschlossenen Regel-kreis sehr nahe kommen. Diese Verläufe sind aber natürlich zum Zeitpunkt der Erstellungder Datenmatrix noch nicht bekannt, da die Datenmatrix selbst zur Modellreduktion unddas reduzierte Modell zum anschließenden Reglerentwurf genutzt werden soll [66]. Um dieseProblem aufzulösen wurden verschiedene iterative Verfahren vorgestellt, die ein zunehmendeVerfeinerung der Ortsauflösung in der Datenmatrix vornehmen, um Rechenzeit zu sparen.Diese Ansätze lassen sich insbesondere bei der Verwendung von Optimalsteuerungen (sieheKapitel 5) verwenden, da das zugehörige Optimierungsproblem ebenfalls auf dem sich stück-weise verfeinernden Gitter gelöst werden kann [1]. Ohne Verwendung dieser zeitaufwändigerenVerfahren werden meist Anregungsfunktionen u gewählt, die in Anlehnung an die Sprungant-worten der linearen Systemtheorie versuchen, über sprungartige Anregungen den gesamtenFrequenzbereich anzuregen. Da im Falle einer Aktuierung durch die Randbedingungen derPDE u der Eingang des reduzierten Modells ist, müssen die Sprünge dabei gefiltert werden,um numerische Ungenauigkeiten zu vermeiden.

37

Page 50: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse
Page 51: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden derModellreduktion

Die im vorangegangenen Abschnitt 3 dargestellten Methoden der Modellreduktion sind nichtuneingeschränkt auf die in dieser Arbeit untersuchten Systeme anwendbar. Wie im Stand derTechnik bereits dargelegt, wird die Galerkin-Projektion in Kombination mit der POD zwar ofterfolgreich für Strömungsprozesse eingesetzt. Dennoch handelt es sich bei der POD um einVerfahren, dass implizit lineare Strukturen bei der Reduzierung der Modelle voraussetzt. Diesliegt daran, dass bei der Lösung des Minimierungsproblem analog zu einer Regressionsrech-nung ein niedrigdimensionaler, linearen Unterraum (also eine Hyperbene) gesucht wird, welchedie Daten gut approximiert. Damit wird vorausgesetzt, dass die zu reduzierenden Snapshot-Daten eben einen solchen linearen Raum bilden. Da jedoch Strömungsprozesse wie in 2.1hergeleitet stets nichtlineare Prozesse sind, ist diese Annahme bestenfalls näherungsweise er-füllt. Im Zusammenhang mit den Navier-Stokes-Gleichungen kann hier beobachtet werden,dass mit zunehmender Reynoldszahl – und der damit verbundenen zunehmenden Dominanzder nichtlinearen Terme über die linearen Terme – die Qualität der über POD und Galerkingewonnenen reduzierte Modelle stark abnimmt. Um der durch die steigende Nichtlinearitäthervorgerufene Erschwerung der Modellreduktion zu begegnen, sollen in dieser Arbeit dreineue Verfahren vorgestellt werden.

Abschnitt 4.1 widmet sich der Untersuchung von neuen maßgeschneiderten Verfahren, dieder Welt der nichtlinearen Dimensionsreduktion entnommen und hingehend auf die im Fo-kus stehenden nichtlinearen Strömungsprozesse angepasst werden. Dabei wird im Schemader Galerkin-Projektion die auf linearen Annahmen basierende POD durch diese nichtlinearenDimensionsreduktionsmethoden ersetzt. Die Integration dieser Verfahren wird hierbei so vor-genommen, dass eine generell einsetzbare Struktur entsteht, in welcher viele der vorteilhaftenEigenschaften der POD erhalten bleiben. Diese Ausführungen basieren auf der Veröffentli-chung des Autors in [83].

Des Weiteren ist es eine oftmals auftretende Eigenschaft bei komplexen Strömungen, dassderen numerische Lösung enorme Zeit benötigt. Dadurch können die für die Modellreduktionbenötigten Snapshot-Daten nicht für den gesamten zu analysierende Arbeitsbereich, son-dern nur für ausgewählte Arbeitspunkte in diesem Bereich zur Verfügung gestellt werden.Erstellt man nun für jeden dieser Arbeitspunkte ein reduziertes Modell, so liegt ein einfachesInterpolieren dieser reduzierten Modelle nahe. Dieses Vorgehen bedarf jedoch aufgrund derNichtlinearität der reduzierten Modelle angepasster Methodik. Deshalb werden in Abschnitt

39

Page 52: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

4.2 Interpolationsmethoden für nichtlineare reduzierte Modelle vorgestellt, die es ermöglichen,in Echtzeit ein passendes nichtlineares Modell für den aktuelle Arbeitspunkt abzuleiten. DieseAusführungen basieren auf den Veröffentlichungen des Autors in [82] und [84].

Statt über die Verwendung nichtlinearer Modellreduktion oder die Interpolation der reduzier-ten Modelle den Gültigkeitsbereich der reduzierten Modelle zu vergrößern wird als dritteseine Adaption von reduzierten Modellen anhand aktueller Messungen untersucht. Auch hierist die Methodik durch die Art des verwendeten Adaptionsverfahrens, welches auf der Schät-zung künstlicher Viskositäten basiert, an den Fall von Strömungsprozessen angepasst. DieseAusführungen basieren auf der Veröffentlichung des Autors in [85].

4.1 Nichtlineare Modellreduktion

4.1.1 Generelle Struktur

In der Darstellung der diskreten Implementierung der POD in Abschnitt 3.2.3 wurden verschie-dene vorteilhafte Eigenschaften der POD erläutert. Anlehnend an [83] sind dabei insbesonderedie folgenden Eigenschaften (E1) bis (E6) zu nennen:

(E1) Die Basisfunktionen werden unter Verwendung von Snapshots berechnet.

(E2) Die Basisfunktionen werden durch ein Optimierungsproblem beziehungsweise eine Kor-relationsanalyse gewonnen. Für die POD entspricht die Minimierung des quadratischenFehlers der Korrelationsanalyse.

(E3) Die Basisfunktionen können nach ihrer Wichtigkeit (Informationsgehalt) sortiert werden.

(E4) Die Basisfunktionen können durch die Lösung des adjungierten Problems gelöst werden,indem statt der (ortsabhängigen) Basisfunktionen die (zeitabhängigen) Koeffizientenberechnet werden. Die Basisfunktionen werden dann in einem zweiten Schritt mithilfeder Koeffizienten ermittelt.

(E5) Die Basisfunktionen sind orthonormal.

(E6) Die Basisfunktionen erben homogene Eigenschaften wie homogene Randbedingungenoder Divergenzfreiheit von den Snapshot-Daten.

Ob die Eigenschaft (E1) eine positive Eigenschaft der POD ist, kann dabei insofern kontroversdiskutiert werden, als die Verwendung von Snapshots zwar ein sehr einfacher und allgemeinverwendbarer Zugang zum Systemverhalten darstellt, bei nichtlinearen Systemen jedoch – wieim Stand der Technik dargestellt – oftmals zu Robustheitsproblemen führen kann, wenn Dyna-miken in den Snapshot-Daten nicht adäquat wiederzufinden sind. Dennoch stellen Snapshotsoftmals nicht nur einen einfachen, sondern den einzigen Zugang zum Systemverhalten dar.

40

Page 53: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.1 Nichtlineare Modellreduktion

Neben diesen positiven Eigenschaften der POD kann jedoch beobachtet werden, dass ins-besondere bei nichtlinearen Systemen die Qualität der mit POD und Galerkin-Projektionhergeleiteten Modelle oft nicht ausreichend ist. Während die Galerkin-Projektion die Nicht-linearität der Systemgleichungen berücksichtigt, nimmt die POD durch ihren Versuch einerPCA beziehungsweise einfachen Korrelationsanalyse über die Snapshot-Daten eine inhärenteLinearität des Systems an. Daher bietet es sich an, die Kombination der beiden Verfahren PODund Galerkin-Projektion insofern aufzubrechen, als dass die POD durch ein anderes Verfahrenersetzt wird. Da die POD in ihrer diskretisierten Form der PCA aus der Dimensionsreduk-tion entspricht, scheinen hier insbesondere nichtlineare Verfahren der Dimensionsreduktiongeeignet. Nichtsdestoweniger muss es das Ziel beim Ersetzen der POD durch ein anderesVerfahren sein, die aufgeführten Eigenschaften (E1) bis (E6) der POD auf die neuen Verfah-ren zu übertragen, sofern dies möglich ist. Daraus leiten sich die im Folgenden diskutiertenvier Forderungen an die nichtlinearen Dimensionsreduktionsverfahren ab:

(F1) Das Verfahren sollte die (diskretisierten) Basisfunktionen über Snapshot-Daten berech-nen.

Diese Forderung ist einfach zu erfüllen, da Dimensionsreduktionsverfahren üblicherweise aufgroßen Matrizen arbeiten. Das Verwenden identischer Snapshot-Daten ist zudem eine we-sentliche Voraussetzung für die sinnvolle Vergleichbarkeit der Verfahren untereinander. Zubemerken ist hierbei jedoch, dass die POD durch ihre Herleitung auf der nicht-diskretisiertenEbene der PDEs eine größere mathematische Aussagekraft und einen besseren theoretischenUnterbau besitzt als ein nichtlineares Verfahren, das lediglich auf den Snapshot-Daten ope-riert. Es bleibt dabei stets im Hinterkopf zu behalten, dass für die nichtlinearen Verfahren,die als POD-Ersatz genutzt werden, der Grenzwertübergang hin zu kontinuierlichen x und tim Gegensatz zur POD zunächst nicht gegeben ist.

(F2) Dem Verfahren sollte entweder eine Optimierung oder eine (nichtlineare) Korrelations-analyse zugrunde liegen.

Die meisten Dimensionsreduktionsverfahren basieren auf Optimierung oder Korrelationsana-lysen, weshalb diese Forderung nur geringe Einschränkungen bezüglich der zu verwendendenMethoden mit sich bringt.

(F3) Das Verfahren sollte eine Sortierung der Basisfunktionen nach ihrer Wichtigkeit bein-halten.

Die Sortierungseigenschaft (E3) erfolgt bei der POD durch die Sortierung der Eigenwerte. FürVerfahren, die auf der Berechnung von Eigenwerten beruhen, kann daher eine analoge Sor-tierung vorgenommen werden. Eine andere Möglichkeit, eine Sortierung der Basisfunktionenvorzunehmen, bieten iterative Dimensionsreduktionsverfahren, für welche die Basisfunktio-nen der POD oder eine andere sortierte Funktionenbasis als Startlösung verwendet werdenkann. In diesem Fall kann eine Sortierung der Basisfunktionen jedoch meist nicht garantiertwerden.

(F4) Das Verfahren sollte so formuliert werden, dass die (diskretisierten) Koeffizienten stattder Basisfunktionen berechnet werden.

41

Page 54: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

Analog zum Falle der POD ist bei der Lösung des adjungierten Problems eine drastische Ein-sparung von Rechenzeit zu erwarten, weswegen ein Berechnen der Koeffizienten unbedingtangestrebt werden sollte. Da das Ziel der Dimensionsreduktion jedoch die Bestimmung der(diskretisierten) Basisfunktionen Φ ist, welche in Kombination mit der Galerkin-Projektiondas reduzierte Modell ergeben, stellt sich die Frage, wie diese aus den Koeffizienten ermitteltwerden können. Für die POD war diese Berechnung aufgrund der Analogie von R und Reinfach durchzuführen, was sich jedoch nicht ohne weiteres auf andere Dimensionsredukti-onsverfahren übertragen lässt. Ziel ist es daher, ein Bestimmungsverfahren der Basisfunktionüber die Koeffizienten zu formulieren, das für arbiträre Dimensionsreduktionsverfahren ge-eignet ist. Dabei sollen im Falle der Verwendung der POD sich idealerweise die identischenGleichungen, wie die in Abschnitt 3.2 hergeleiteten, ergeben.

Gemäß (3.22) stellt der Koeffizient ai(t) die Projektion der Basisfunktion ϕ auf die Snapshot-Daten dar. Im Falle der diskretisierten Implementierung mit dem Standard Skalarprodukt unddem Standard Mittelwert führt daher ein simpler Bestimmungsansatz der Basisfunktionenzu

1NtV Φ = A. (4.1)

Ein Versuch, diese Gleichung systematisch nach Φ zu lösen muss jedoch scheitern, da hierfürdie Pseudoinverse von V gemäß (V TV )−1V T gebildet werden müsste. Dadurch würde je-doch die Inverse der Korrelationsmatrix aus der POD verwendet. Da die Grundannahme derPOD ist, dass die Auswahl weniger Eigenwerte der Korrelationsmatrix ausreicht, um einenguten RIC zu erhalten, ist diese Matrix zwangsweise äußerst schlecht konditioniert. Daher istein Berechnen der Basisfunktionen als die Vektoren, auf welche projiziert werden muss, umdie Koeffizienten zu erhalten, nicht sinnvoll. Es muss also nach einer alternativen Bestim-mungsgleichung für die Basisfunktionen unter Nutzung der Koeffizienten gesucht werden.

Im Falle der POD wird die Umrechnung der Koeffizienten und Basisfunktionen durch dieTatsache gelöst, dass die Koeffizienten zeitlich unkorreliert sind und sich die Moden über(3.25) durch die Koeffizienten darstellen lassen. Im diskretisierten Fall ergibt sich hieraus dieBerechnungsvorschrift

Φ(i) = 1λiNx

V TA(i) (4.2)

für die i-te Basisfunktion und den i-ten Koeffizienten. Verwendet man diese Formel, so istjedoch der Koeffizient A(i) im Allgemeinen nicht mehr die Projektion der Snapshot-Datenauf die Basisfunktion. Um auch diese Eigenschaft zu erfüllen müsste

1NtV Φ(i) = 1

NtNxλiV V TA(i) != A(i) (4.3)

42

Page 55: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.1 Nichtlineare Modellreduktion

gelten. Diese Gleichung ist aber nur erfüllt, falls A(i) ein Eigenvektor von R zum Eigenwertλi ist und damit über die POD ermittelt wurde. Damit entspricht bei der Verwendung von(4.2) der zeitabhängige Koeffizient nur dann der Projekt der Basisfunktionen, wenn die PODzur Bestimmung der Basisfunktionen verwendet wurde.

Weitere scheinbare Nachteile von (4.2) sind, dass die über diese Formel berechneten Ba-sisfunktionen nicht orthonormal und die λi unbekannt sind, da diese die Eigenwerte derKorrelationsmatrix der POD sind. Diese Nachteile fallen jedoch weniger ins Gewicht, da dieberechnete Funktionenbasis über einfache Algorithmen wie beispielsweise das Orthogonalisie-rungsverfahren nach Gram und Schmidt schnell in eine orthonormale Basis überführt werdenkann. Wird dieser notwendige Orthonormalisierungsschritt durchgeführt, ist ein Skalieren derKoeffizienten über λi nicht mehr notwendig. Die Unabhängigkeit der Basis von der Skalie-rung wird im Folgenden in einer stärkere Version nachgewiesen. Und zwar wird gezeigt, dasszwei unterschiedliche Basen Φ, die über (4.2) berechnet werden, genau dann den identischenUnterraum aufspannen, wenn die dafür verwendeten zeitlichen Koeffizienten A ebenfalls den-selben Unterraum beschreiben. Dies impliziert, dass eine Skalieren oder ein Vertauschen oderjede lineare Abbildung, die auf die Koeffizienten angewandt wird, die durch die Dimensions-reduktion ermittelten Unterraum der Basisfunktionen nicht verändert, wenn (4.2) verwendetwird.

Seien dazuA1 undA2 ∈ RNt×N zwei Funktionenbasen desselben Unterraums. Dann lässt sichjeder Spaltenvektor von A2 durch eine Linearkombination der Spalten von A1 und umgekehrtbeschreiben, weswegen eine invertierbare Transformationsmatrix T ∈ RN×N mit A1T = A2existiert. Dann beschreiben jedoch die über (4.2) berechneten Funktionenbasen Φ1 und Φ2wegen

Φ2 = 1λiNx

V A2 = Φ1 T (4.4)

auch denselben Unterraum. Daher spielt es keine Rolle für den berechneten Unterraum, obdie Koeffizienten skaliert werden oder nicht. Die Skalierung kann in diesem Zusammenhangnur als eine Vorkonditionierung des Orthonormalisierungsverfahrens verstanden werden. Indiesem Kontext bietet es sich an, die Koeffizienten über T =

(ATA

)−1zu skalieren. Denn

im Falle der POD entspräche dies genau der Skalierung über die Eigenwerte aufgrund ihrerKorrelation in (3.24). Durch die Verwendung von A werden zudem die POD-Eigenwerte λ beidieser Skalierung nicht benötigt. Die Kondition von ATA ∈ RN×N ist dabei gut, da hier nurdie für das reduzierte Modell ausgewählten Koeffizienten berücksichtigt werden. Weiterhinwird durch die Unabhängigkeit des Unterraums bezüglich linearer Operationen klar, dass dienegative Eigenschaft, dass die Koeffizienten sich bei dieser Berechnung der Basisfunktionennicht mehr als Projektion der Basisfunktionen ergeben, sich nicht durch eine einfache Trans-formation beheben lässt.

43

Page 56: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

Abschließend ergibt sich die Bestimmungsvorschrift der Basisfunktionen über die zeitabhän-gigen Koeffizienten daher zu

Φ = 1Nx

(ATA

)−1V TA. (4.5)

Die Berechnungsvorschrift (4.5) sorgt für eine Erfüllung der wichtigen Eigenschaft (E6). Dennüber das Projizieren der Koeffizienten auf die Snapshot-Daten ergibt sich jede Basisfunktionals Linearkombination der Snapshots. Dies ist die zentrale Bedingung, die erfüllt sein muss,damit die Basisfunktionen homogenen Eigenschaften von den Snapshot-Daten übernehmen.Eine Berechnung der Basisfunktionen über (4.1) würde diese Eigenschaft nicht liefern, da sichdort keine Linearkombination der Snapshots ergibt, wenn A über eine nichtlineare Methodegewonnen wurde.

Zusammenfassend stellt (F4) die komplizierteste Forderung dar, die nur mit einem von derPOD abweichenden Schema erfüllt werden kann. Dabei ermöglicht das Verfahren, die Basis-funktionen mittels (4.5) über die Projektion der (nichtlinear berechneten) Koeffizienten aufdie Snapshot-Daten zu berechnen, ein sofortiges Erfüllen der zentralen Eigenschaft (E6). DieSkalierung der Koeffizienten in dieser Projektion verwandelt sich in eine Vorkonditionierungdes nachfolgenden Orthonormalisierungsverfahrens. Festzuhalten bleibt, dass die Projektionder so ermittelten Basisfunktion auf die Snapshot-Daten nicht mehr die nichtlinear berechne-ten Koeffizienten ergibt, mit denen die Basisfunktionen selber berechnet wurden. Ein Abgleichder Ergebnisse für die reduzierten Modelle muss daher stets mit den über die Projektion ge-wonnenen und nicht mit den nichtlinear ermittelten Koeffizienten erfolgen. Auch wenn dieseModifikation auf den ersten Blick als Einschränkung wahrgenommen werden mag, so kann –wie weiter oben gezeigt – die Erfüllung dieser Eigenschaft nicht erwartet werden, sofern nichtdie POD verwendet wird und die Eigenschaft (E6) erfüllt sein soll. Andererseits verbirgt diesesBerechnungsschema die konkrete Ausgestaltung der Nichtlinearität, die in der nichtlinearenDimensionreduktionsmethode möglicherweise verwendet worden ist, vor den Basisfunktionenund verwendet diese nur für die Koeffizienten. Dadurch bildet dieses Berechnungsschema eingenerelle Struktur, in das nahezu beliebige Dimensionsreduktionsmethoden eingebaut werdenkönnen. Dabei ergibt sich bei der dargestellten Vorgehensweise im Falle des Verwendens derPCA als Dimensionsreduktionsmethode die identischen Resultate zur Standard-POD.

Insgesamt verhält sich die generalisierte Struktur zur nichtlinearen Modellreduktion wie folgt:Die Galerkin-Projektion bleibt identisch zum Falle der POD erhalten. Die Berechnung der Ba-sisfunktionen erfolgt jedoch durch nichtlineare Dimensionsreduktionsmethoden. Diese werdendabei zur Ermittlung der zeitdiskretisierten Koeffizienten verwendet, während die Ermittlungder Basisfunktion nach dem soeben erläuterten Verfahren vorgenommen wird. Infrage kom-mende Reduktionsverfahren sollten auf Snapshots basieren und durch Optimierung oder Kor-relationsanalyse eine Sortierung der Koeffizienten nach ihrer Wichtigkeit vornehmen. Bevorin den folgenden Unterkapiteln einzelne Verfahren, welche sich in die beschriebene Strukturintegrieren lassen, erläutert werden, um die Vorteile dieser allgemein anwendbaren Struktur

44

Page 57: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.1 Nichtlineare Modellreduktion

aufzuzeigen, müssen zum Verständnis allgemeinere Konzepte der nichtlinearen Dimensionsre-duktion geschaffen werden. Diese wurden nicht in den vorherigen Abschnitten behandelt, dasie nicht Teil der klassischen Grundlagen der Modellreduktion sind.

4.1.2 Nichtlineare Dimensionsreduktion

Im Forschungsfeld der nichtlinearen Dimensionsreduktionsverfahren gibt es zahlreiche Metho-den, über die [67] eine gute Übersicht bietet. Die grundsätzliche Idee im Vergleich zur PODbeziehungsweise PCA ist dabei wie folgt: Die PCA berechnet über die gesamten verwende-ten Daten einen niedrigdimensionalen linearen Raum, in welchem die Daten so repräsentiertwerden können, dass der quadratische Fehler zwischen den ursprünglichen Daten und derDaten, wenn sie in dem niedrigdimensionalen Raum dargestellt werden, minimiert wird. Diesentspricht einer klassischen Regressionsrechnung, bei der eine Hyperebene in die Datenmengegelegt wird. Bilden die Daten eine niedrigdimensionalen und annähernd linearen Raum, soliefert diese Reduktionsmethode gute Ergebnisse. Handelt es sich bei dem Raum, den die Da-ten bilden, zwar um eine niedrigdimensionale Struktur, die aber nicht linear (das heißt: keineHyperebene) ist, so muss die Dimension höher als die Dimension der eigentlichen Strukturgewählt werden.

Niedrigdimensionale Strukturen, die nichtlinear sind, werden mathematisch durch das Kon-zept der (differenzierbaren Riemann-)Mannigfaltigkeiten beschrieben. Anschaulich kann eineMannigfaltigkeit M als eine Art gekrümmter Raum verstanden werden, der nicht zwingendidentisch zum Rn ist, aber in jedem Punkt auf der Mannigfaltigkeit lokal wie der Rn aussieht[58]. Das klassische veranschaulichende Beispiel ist hierfür die Oberfläche einer Kugel. In je-dem Punkt auf der Kugeloberfläche ähnelt die Umgebung einer Ebene (und damit dem R2),was die frühe Menschheit zu der Annahme veranlasste, die Erde sei eine Scheibe. Die Dimen-sion der MannigfaltigkeitM wird dann zu n definiert. Dies macht es wiederum notwendig zufordern, dass das zu verwendende n des Raumes Rn, dem M lokal gleicht, für alle Punktex ∈ M identisch sein muss. Die einzelnen Rn werden auch als Karten bezeichnet, wobei esfür jede Karte eine hinreichend glatte Abbildung von einer Umgebung um x ∈ M auf dieKarte gibt. Eine MannigfaltigkeitM zeichnet sich nun dadurch aus, dass es einen Atlas gibt(also eine Menge von Karten), mithilfe dessen M vollständig überdeckt werden kann. DasKonzept der Mannigfaltigkeiten erlaubt damit eine Krümmung des Raums aber auch nichtzusammenhängende Flächen, da nicht gefordert wird, dass die Mannigfaltigkeit global demRn gleichen muss. Das Symbol ’8’ ist hingegen keine Mannigfaltigkeit, da im Kreuzungspunktder beiden Kreise die Karte zweidimensional, in allen anderen Punkte jedoch eindimensionalist.

Neben der Interpretation der Mannigfaltigkeit als Menge lokaler Karten kann eine Mannig-faltigkeit auch als Nullstellenmenge einer glatten Funktion aufgefasst werden. Diese Funktionsorgt dabei anschaulich als Nebenbedingung dafür, dass der Lösungsraum eingeschränkt wirdund sich eine glatte Struktur mit niedrigerer Dimension ergibt. So kann der Einheitskreisals eindimensionale Mannigfaltigkeit als Nullstellen-Menge der Funktion f : R2 → R mit

45

Page 58: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

f(x1,x2) = 1−x21−x2

2 aufgefasst werden. Analog zur identischen Dimension der verschiede-nen Karten formuliert man hier die Forderung, dass die Jacobi-Matrix Df in allen Punktenx mit f(x) = 0 vollen Rang hat. Die Äquivalenz beider Sichtweisen auf Mannigfaltigkei-ten ist durch entsprechende mathematische Resultate sichergestellt. In Verbindung mit derAufgabenstellung der Dimensionsreduktion ist die zweite Interpretation von Mannigfaltigkei-ten naheliegender. Während die PCA annimmt, dass die Snapshot-Daten auf einem linearenUnterraum liegen (der sich als Hyperebene bei der Verwendung einer linearen Funktion fergibt), wird diese Annahme bei der Verwendung einer Mannigfaltigkeit fallengelassen undauch nichtlineare Funktionen f zugelassen. Da die Differentialgeometrie im Einbettungssatzvon Whitney aussagt, dass sich jede n-dimensionale Mannigfaltigkeit sich über eine Funktionf : R2n → Rn beschreiben lässt, kann durch die Aufweichung der Restriktion auf linea-re Funktionen mit einer Dimensionsreduktion bis maximal zum Faktor 2 gerechnet werden.Nichtlineare Dimensionsreduktionsverfahren versuchen, eine Mannigfaltigkeit zu finden, diedie Snapshot-Daten gut approximiert.

Klassischerweise werden die Verfahren der Dimensionsreduktion in solche, die Abstände erhal-ten, und solche, die Topologien erhalten, unterteilt [67]. Diese Unterteilung ist nicht trenn-scharf, da topologie-erhaltende Verfahren oft auch versuchen, Abstände zu erhalten. Hier istmit dem Begriff des Erhaltens gemeint, dass Eigenschaften – wie beispielsweise die Abstän-de der Snapshots untereinander – sich durch die Abbildung auf die Mannigfaltigkeit nichtwesentlich ändern. Topologie-erhaltende Verfahren versuchen nicht nur diese Abstände zuerhalten, sondern die Topologie der Daten in der niedrigdimensionalen Mannigfaltigkeit zubewahren. Mit Topologie sind hierbei Struktureigenschaften einer Menge gemeint, die sichunter stetigen, bijektiven Abbildungen nicht verändern. Hierzu gehören insbesondere Löcherund zusammenhängen Gebiete der Menge. Beispielsweise besitzen ein Donut und eine Tassemit einem Henkel die gleiche Topologie, da sich die Tasse durch eine bijektive Abbildung,die ebenso wie ihre Umkehrabbildung stetig ist, in eine Donut verformen lässt. Topologie-erhaltende Verfahren versuchen durch die geeignete Approximation eines einbettenden Ope-rators die Topologie der Snapshot-Daten in der Mannigfaltigkeit zu erhalten. Im Weiteren solldie Unterteilung der einzelnen Verfahren nicht nach [67] vorgenommen werden, sondern nachder algorithmischen Struktur. Dabei werden Verfahren herausgegriffen, die iterativ eine beste-hende Lösung verbessern, auf Künstlichen Neuronalen Netzen oder auf graphentheoretischenÜberlegungen basieren.

4.1.3 Reduktion mittels iterativer Verfahren

Es wurde bereits erläutert, dass die POD den quadratischen Fehler, der bei der Projektion derSnapshot-Daten auf den aufgespannten Unterraum entsteht, durch eine optimale Hyperebeneminimiert. Die Minimierung dieses Projektionsfehlers ist ebenfalls, damit verbunden, dassdie Abstände zwischen verschiedenen Snapshots sich durch den Projektionsvorgang nichtwesentlich ändern. Seien hierzu vj und vi ∈ RNx zwei Snapshots und dij der Abstand zwischenbeiden Snapshots in einer passenden Metrik d(x, y). Hier kann beispielsweise die Metrik, diesich aus der vom Skalarprodukt der POD induzierten Norm ergibt, gewählt werden. Projiziert

46

Page 59: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.1 Nichtlineare Modellreduktion

man den Snapshot vj auf den Unterraum, der durch die (im Ort diskretisierte und damit alsMatrix vorliegende) Basis Φ aufgespannt wird, so erhält man den projizierten Snapshot

vPj =N∑i=1〈vj, Φi〉Nx ·Φi , vPj ∈ RNx (4.6)

Hier kann ein beliebiges Skalarprodukt des RNx verwendet werden. Weiter ergibt sich für dieDifferenz zwischen dem Abstand dij und dem Abstand zwischen der projizierten SnapshotsdPij unter Verwendung der Dreiecksungleichung die Abschätzung

d(vPi ,vPj )−d(vi,vj) ≤ d(vPi ,vi)+d(vi,vj)+d(vj,vPj )−d(vi,vj) = d(vi,vPi )+d(vj,vPj ).(4.7)

Diese Abschätzung ist auch in der nicht-diskretisierte Variante in separablen Hilberträumengültig. Sie bedeutet, dass die Veränderung der Abstände der Snapshots untereinander auf-grund der Projektion durch die Summe der Projektionsfehler der Snapshots beschränkt ist.Damit nimmt die POD, die den Projektionsfehler minimiert, gleichzeitig auch einen Erhalt derAbstände der Snapshots untereinander vor. Dennoch adressiert die POD diesen Abstandser-halt nicht direkt sondern nur indirekt über den Projektionsfehler und (4.7). Da das Erhaltender Abstände als eine Form der Minimierung des Informationsverlustes durch die Projektionverstanden werden kann, scheint es sinnvoll, Dimensionsreduktionsverfahren zu untersuchen,die den Abstandserhalt direkt einbeziehen.

Ein klassisches Verfahren der nichtlinearen Dimensionsreduktion, welches dies vornimmt, istdie Sammon-Projektion, die erstmalig in [98] vorgestellt wurde. Bei dieser Methode wird einenichtlineare Gütefunktion, welche die zueinander gewichteten Abstände vor und nach der Pro-jektion enthält, minimiert. Da dieses Optimierungsproblem eine weitaus komplexere Strukturals das der POD aufweist, kann es im Allgemeinen nicht direkt analytisch gelöst werden, son-dern bedarf numerischer Lösungsverfahren. Hierfür werden Newton-basierte Lösungsverfahrenvorgeschlagen, die durch einzelne Optimierungsschritte eine gegebene Startlösung verbessern.Damit zählt die Sammon-Projektion zu den Dimensionsreduktionsverfahren, die iterativ ab-laufen und nach einer ausgewählten Anzahl von Iterationen oder anderen Kriterien terminiertwerden müssen. In der üblichen Formulierung fordert die Sammon-Projektion die Gütefunkti-on

J(Φ) = 1Nt∑i<j

dij

Nt∑i<j

(dij − dPij(Φ))2

dij. (4.8)

über die Entscheidungsvariablen Φ zu minimieren. Dabei ist nur die Größe dPij durch Projektionentstanden und daher von Φ abhängig. Die Summe erstreckt sich bisNt, daNt Snapshots vor-liegen, zwischen welchen Abstände gebildet werden können. Die Form der Gütefunktion sorgtfür eine relative Gewichtung des durch die Projektion entstehenden Abstandsfehler zu den

47

Page 60: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

ursprünglichen Abständen der Snapshots. Allgemein unterstützt die Ähnlichkeit der Sammon-Gütefunktion (4.8) zum POD-Gütefunktional in Definition 6 die Interpretation einer nichtli-nearen Erweiterung der POD. Weiterhin ist zu beachten, dass im Gegensatz zur POD, wo vomAnsatz her Basisfunktionen einzeln und nacheinander berechnet werden konnten, die gesamteMatrix Φ als Entscheidungsvariable verwendet wird. Damit werden alle Basisfunktionen in ei-ner gemeinsamen Optimierung gefunden. Da es sich hierbei um N ·Nx Entscheidungsvariablenhandelt, kann das Problem oft nur mit immensem Rechenaufwand gelöst werden. Im Rahmender generellen Struktur zur Einbindung der nichtlinearen Dimensionsreduktionsverfahren in dieModellreduktion mittels Galerkin-Projektion ist es daher angezeigt, die Sammon-Projektion soumzuformulieren, dass anstelle von Φ die Nt Entscheidungsvariablen A Verwendung finden.Dazu wird die Analogie des Skalarproduktes und der Mittelwertbildung für die Konstruktionvon R und R herangezogen. Ersetzt man die Projektion der Snapshots auf die Basisfunk-tionen durch das adjungierte Pendant der Mittelwertbildung [·]T der adjungierten Snapshotsvj = V (:,xj) (das heißt: der Spalten statt der Zeilen der Datenmatrix), so erhält man dieprojizierten adjungierten Snapshots

vPj =N∑i=1

[vj,A(i)]T ·A(i) , vPj ∈ RNt . (4.9)

Für die Mittelwertbildung kann beispielsweise die Standard-Mittelwertbildung der POD ver-wendet werden, aber auch andere Mittelwertbildungen sind möglich. Nun liegt eine analogeKonfiguration zum Ausgangspunkt der klassischen Sammon-Projektion vor mit dem Unter-schied, dass Nx Datenpunkte im RNt vorliegen anstatt wie vorher Nt Datenpunkte im RNx .Wählt man nun eine Metrik d(x, y) im RNt nach Wahl [98], so lassen sich genau wie zuvordie Abstände dij und dPij definieren. Die zu minimierende Gütefunktion ergibt sich dann zu

J(A) = 1Nx∑i<j

dij

Nx∑i<j

(dij − dPij(A))2

dij. (4.10)

Im Vergleich zu (4.8) muss die Optimierung nun lediglich über N · Nt N · Nx Entschei-dungsvariablen durchgeführt werden. Im Gegenzug ist allerdings der Auswertungsaufwand derGütefunktion gestiegen, da die Summe nun Nx statt Nt Summanden aufweist. Nichtsde-stoweniger bedeutet die vorgestellte Umformulierung eine enorme Ersparnis von Rechenzeit.Zudem liefert die Optimierung nun die Koeffizienten A, wodurch das Verfahren in die gene-relle Struktur aus 4.1.1 eingebettet worden ist.

Die Sammon-Projektion stellt durch die zugrunde liegende nichtlineare Optimierung ein itera-tives Verfahren da. Bei der Verwendung anderer Gütefunktion als der der Sammon-Projektionkann ein analoges Vorgehen zu dem hier vorgestellten verwendet werden, wodurch die Sammon-Projektion als exemplarischer Repräsentant für iterative Verfahren verstanden werden kann.Die wichtigen Einstellparameter der iterativen Verfahren sind sowohl die Anzahl der Iteratio-nen beziehungsweise das Abbruchkriterium als auch die Wahl der Startlösung, wobei beide

48

Page 61: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.1 Nichtlineare Modellreduktion

sich gegenseitig beeinflussen. Aufgrund der Tatsache, dass nicht nacheinander über einzelneBasisfunktionen minimiert wird, sondern über alle gemeinsam, legt die Wahl der Startlösungzudem auch die Anzahl der verwendeten Basisfunktionen fest. Während bei der POD durchdas Aufstellen des RIC ein Maß vorlag, welches einen heuristischen Schluss auf die notwen-dige Anzahl an Basisfunktionen zuließ, so fehlt dies hier. Daher bietet es sich für iterativeVerfahren an, die POD als Startlösung für die Iteration zu verwenden. Denn auf diese Weisekann die Anzahl der Basisfunktion bereits im Vorhinein bestimmt werden und es liegt wegender Argumentation in (4.7) auch eine gute Startlösung vor. Als weiterer Nebeneffekt liegteine Sortierung der Basisfunktionen vor. Bei einer beliebigen Startlösung für die iterativenVerfahren wie die Sammon-Projektion gibt es keinen Grund, warum die resultierenden Ba-sisfunktionen nach ihrem Informationsgehalt geordnet sein sollten. Wählt man hingegen diePOD als bereits geordnete Lösung, die außerdem eine annehmbare Startlösung darstellt, sokann davon ausgegangen werden, dass zumindest für die ersten Iterationen die Sortierung derBasisfunktionen erhalten bleibt. Eine Garantie hierfür gibt es allerdings nicht.

Im Zusammenhang mit der POD als Startlösung ist weiterhin zu beachten, dass das Ziel, dieAnzahl der benötigten Basisfunktionen zu verringern, nicht erreicht werden kann, wenn dieDimension der POD-Startlösung so hoch gewählt wird, wie die für die POD benötigte Anzahlan Basisfunktionen, da das iterative Verfahren die Anzahl der Entscheidungsvariablen nichtverändert. Möchte man diese Anzahl also reduzieren muss ein RIC-Wert gewählt werden, dergeringer als üblich ist. Zudem sind durch die Anzahl an Entscheidungsvariablen, die linear inder Anzahl an Basisfunktionen N steigt, iterative Verfahren nur für eine kleine Anzahl anBasisfunktion geeignet. Eine Möglichkeit, diese auch bei großen N zu verwenden, bestehtdarin, nur einige wenige Basisfunktion über die iterative Verfahren zu bestimmen und für dierestlichen die POD-Moden zu verwenden. Dies kann dadurch erreicht werden, indem vor derOptimierung gemäß (3.15) die POD-Moden von den Datensätzen subtrahiert werden. DieAnzahl der Iterationen kann weiterhin bei der Verwendung der POD als Initiallösung als einFaktor verstanden werden, der die Grad der Nichtlinearität in der Modenberechnung angibt.Wird die Iterationszahl hoch gewählt, so nimmt die Optimierung potentiell mehr Schrit-te vor, die die POD-Lösung modifizieren um dem Optimum der nichtlinearen Gütefunktionnäherzukommen. Ein geringer Wert lässt hingegen nur wenige Schritte zu, wodurch ein Mo-densatz, welcher der POD ähnlicher ist, erwartet werden kann. Diese Argumentation stelltaber natürlich keinen rigorosen Formalismus dar, da die Schrittweite der Optimierung vari-iert und auch schon mit wenigen großen Schritten die Lösung stark modifiziert werden kann.Nichtsdestoweniger erhöht die Anzahl der Iterationsschritte tendenziell die Nichtlinearität derModellreduktion.

Insgesamt kann bei der Verwendung iterativer Verfahren wie exemplarisch der Sammon-Projektion folgende Aussage zu den Forderungen (F1) bis (F4) getroffen werden: Durch dasVerwenden der adjungierten Snapshotdaten (F1, F4) kann die auf Newton-Verfahren basier-te, iterative Lösung nichtlinearer Optimierungsprobleme (F2) in die generelle Struktur 4.1.1eingebunden werden. Neben der Startlösung, für welche die POD eine naheliegende Optiondarstellt, ist – bei fester Wahl der Gütefunktion – die Anzahl der Iterationen der wichtigsteEinstellparameter, welche als steigender Grad der Nichtlinearität gedeutet werden kann. Das

49

Page 62: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

Erfüllen der Sortierungs-Forderung (F3) kann nicht garantiert werden, auch wenn sortierteStartlösungen für kleine Iterationszahlen ein Erfüllen wahrscheinlicher machen. Ergebnisse derModellreduktion mittels Sammon-Projektion werden bei den Anwendungen in 7 vorgestellt.

4.1.4 Reduktion mittels Künstlicher Neuronaler Netze

Bei der Verwendung Künstlicher Neuronaler Netze zur Dimensionsreduktion handelt es sichstreng genommen ebenfalls um ein iteratives Verfahren, da Künstliche Neuronale Netze inder Regel iterativ trainiert werden. Dennoch sollen diese aufgrund ihrer stark wachsendenPopularität, des gestiegenen öffentliches Interesses (gefördert durch medienwirksame Ereig-nisse wird den Go-Computer ’AlphaGo’ oder andere Formen der künstlichen Intelligenz) undder breiten Anwendbarkeit in einem separaten Unterkapitel diskutiert werden. Zudem könnenKNNs auch als Graphen interpretiert werden und bilden somit eine Art Brücke zwischen deniterativen und den graphenbasierten Verfahren. KNNs wurden in einer ähnlichen wie der hierim Folgenden präsentierten Weise auch 2017 von Hartmann [47] umgesetzt – ohne auf dasein Jahr vorher erschienene Paper des Autors in [83] zu verweisen.

Künstliche Neuronale Netze stellen eine beliebte Methode dar, die Principal Component Ana-lysis auf nichtlineare Systeme zu erweitern [61]. Aufgrund der Analogie der POD zur PCA liegtes daher nahe, Künstliche Neuronale Netze zu studieren. Inspiriert von der Funktionsweisedes menschlichen Gehirns besteht ein Künstliches Neuronales Netz [63] dabei aus endlich vie-len Neuronen, die über gerichtete Verbindungen einander Informationen zusenden. Entstehenhierbei keine Schleifen, so werden die Informationen nur in eine Richtung weitergegeben undman spricht von einem feed forward network. Ein Neuron besteht dabei in der allgemeinenDefinition aus drei Funktionen: der Eingabefunktion, der Ausgabefunktion und der Aktivie-rungsfunktion. Gibt es zu einem Neuron Nv Neuronen, die ihm Informationen zusenden, undNn Neuronen, dem es Informationen zusendet, so bilden die drei Funktionen von RNv → R(Eingabefunktion), R → R (Aktivierungsfunktion) und R → RNn (Ausgabefunktion) ab.Die Ein- und Ausgabefunktion kann dabei als Gewichtung der Ein- und Ausgänge verstan-den werden, während die Aktivierungsfunkion entscheidet, ob das Neuron feuert (das heißtInformationen weitergibt) oder nicht. Werden die Ein- und Ausgabefunktion linear gewählt,können sie als Gewichte den gerichteten Verbindungen zugeordnet werden und werden ineiner graphischen Darstellung der Künstlichen Neuronalen Netze üblicherweise oberhalb die-ser Verbindungen notiert. Erhält ein Neuron nicht nur Informationen von anderen Neuronen,wird es als Eingangsneuron bezeichnet, während ein Neuron, dass Informationen nicht nuran andere Neuronen weitergibt, Ausgangsneuron heißt. Alle Neuronen, die weder Eingangs-noch Ausgangsneuronen sind, werden versteckte Neuronen genannt. Künstliche NeuronaleNetze werden oft in Schichten unterteilt, wobei alle Neuronen einer Schicht gemeinsam ha-ben, dass sie ihre Informationen aus derselben Schicht erhalten und ihre Informationen andieselbe Schicht weitersenden. Alle Eingangs- und Ausgangsneuronen werden hier meist zueiner Eingangs- und Ausgangsschicht zusammengefasst, während die versteckte Neuronenmehreren Schichten zugeteilt werden. Ein einfaches feed forward Netz mit einem Eingangs-,

50

Page 63: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.1 Nichtlineare Modellreduktion

einem Ausgangs- und zwei versteckten Neuronen ist in der folgenden Abbildung 4.1 dargestellt.

Eingangs-schicht

VersteckteSchicht

Eingang

Ausgangs-schicht

W11

W21

W12

W22Eingangs-neuron

Ausgangs-neuron

Gewichte

Ausgang

Abbildung 4.1: Beispielhaftes Künstliches Neuronales Netz

Aufgrund der linear gewählten Ein- und Ausgabefunktion wurden diese als Gewichte auf denVerbindungslinien notiert. Man sieht, dass die Gewichte zwischen den jeweiligen Schichtenals Matrix W 1 ∈ R1×2 und W 2 ∈ R2×1 zusammengefasst werden können. Mit identi-schen Aktivierungsfunktionen f und dem Eingang u ergäbe sich der Ausgang des KNN zuf(W 2f(W 1f(u))), wobei im Falle der versteckten Schicht f komponentenweise auf denVektor W 1f(u) angewandt wird.

Künstliche Neuronale Netze werden in der Regelungstechnik gelegentlich – wie auch im Standder Technik dargestellt – als modellfreie Regelungsverfahren genutzt. Ihr üblicherer Verwen-dungszweck ist allerdings das Extrahieren von Merkmalen anhand von Daten wie beispielsweisebei der Bild- oder Texterkennung. Dieser zweite Anwendungsfall ist dem der PCA sehr ver-wandt, weshalb zahlreiche Umsetzungen der PCA in Form eines KNN existieren [30]. DasLösen des PCA-Optimierungsproblems erfolgt hier durch das Trainieren des KNN. Dies ge-schieht beim überwachten Lernen durch den Abgleich des Ausgangs mit einem vorgegebenenSollwert. Der dabei auftretende Fehler kann mittels numerischer Verfahren, von denen dieBackpropagation (Fehlerrückübertragung [63]) zu den verbreitetsten zählt, auf die geeigneteAnpassung der GewichteW zurückgerechnet werden. Um ein ’Überlernen’ (siehe zum Beispiel[61]) des KNN zu unterbinden, wird die Menge der Eingangsdaten üblicherweise in verschie-dene Datenmengen unterteilt, die zum Training, zum Testen und zur Validierung verwendetwerden. Eine der PCA-Umsetzungen lässt sich einfach und effizient zu einer nichtlinearenPCA-Umsetzung erweitern [61]. Hierzu wird ein sogenannter Autoencoder verwendet, dessenStrukturbild in Abbildung 4.2 dargestellt ist.

Der Autoencoder besteht aus einer Eingangsschicht, drei versteckten Schichten und einerAusgangsschicht. Die Gewichte wurden bereits in Matrixform notiert. Im Rahmen des über-wachten Lernens wird dabei vom Autoencoder gefordert, die Identität als Abbildung zu er-lernen, das heißt, dass die Sollwerte des Ausgangs gleich dem Eingang sind. Dabei nimmtder Autoencoder dadurch eine Dimensionsreduktion vor, dass die zweite versteckte Schicht

51

Page 64: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

N1

Eingangs-schicht

Zwischen-schicht Flaschenhals-

schicht

N2 N

Daten = Daten!

N2 N1

Zwischen-schicht

Ausgangs-schicht

KnotenanzahlW

1W

2 W 3

W 4

Abbildung 4.2: Strukturbild eines Autoencoders

wesentlich weniger Neuronen als die Ein- und Ausgangsschicht enthält. Hierdurch muss derAutoencoder in den Neuronen dieser Schicht möglichst viele Informationen der Eingangs-schicht komprimieren, um aus diesen die am Eingang anliegenden Daten am Ausgang erneutbilden zu können. Deshalb wird die mittlere versteckte Schicht auf als Flaschenhalsschichtbezeichnet. Die beiden weiteren versteckten Schichten, die auch Zwischenschichten genanntwerden, ermöglichen dem KNN mehr Freiheitsgrade und damit ein besseres Abbilden derIdentität. Der Autoencoder bildet dabei ein nichtlineare Dimensionsreduktionsvariante, da dieAktivierungsfunktionen der Neuronen nichtlinear gewählt werden können.

Zur Formulierung des Autoencoders zum Bestimmen der Basisfunktionen gibt es nun mehrereMöglichkeiten. Liegen die Snapshot-Daten als Nt ×Nx-Matrix vor, so können entweder NxEingangsneuronen verwendet werden, die mit Nt verschiedenen Snapshots trainiert werden,oder es werden Nt Eingangsneuronen mit Nx Trainingseingaben genutzt. Es ist offensichtlich,dass wegen Nt Nx für ein effizientes Trainieren des Künstlichen Neuronalen Netzes diezweite Variante zu bevorzugen ist, da die größere Menge an Trainingsdaten für eine weitausgeringere Anzahl an zu optimierenden Gewichten zu verlässlicheren Resultaten führen wird.Im Falle der zweiten Variante entspricht die Abbildung von den Eingangsneuronen zur denNeuronen der Flaschenhalsschicht den Basisfunktionen Φ. Daher wäre es möglich, die Ba-sisfunktion direkt dadurch zu berechnen, indem man alle Nx Snapshots in das NeuronaleNetz hineinschickt. Für jeden Ortsdiskretisierungspunkt erhält man dann N -Werte, die anden Neuronen der Flaschenhalsschicht anliegen. Die sich dadurch ergebenden Verläufe überdie Ortsdiskretisierungsvariable stellen dann die N Basisfunktionen Φ dar. Aus der Forderung(F4) ist jedoch bekannt, dass diese Basisfunktionen nicht effektiv für die Modellreduktion vonStrömungsprozessen verwendet werden können, da der Erhalt homogener Eigenschaften nichtgarantiert werden kann. Daher ist es sinnvoller, die Koeffizienten A zu ermitteln. Dies kanndadurch erfolgen, dass nach erfolgreichen Trainieren das Netz in der Flaschenhalsschicht so

52

Page 65: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.1 Nichtlineare Modellreduktion

aufgetrennt wird, dass die N Neuronen der Flaschenhalsschicht als Eingangsneuronen fungie-ren. Wählt man nun die Einheitsvektoren als Eingänge für die Eingangsneuronen, so erhältman am Ausgang die Nt-Werte, die zu N Neuronen der Flaschenhalsschicht gehören unddamit die (nichtlinear bestimmten) Koeffizienten A. Gemäß Forderung (F4) ergeben sich dieBasisfunktion wie auch bei den zuvor erläuterten Verfahren mittels linearer Projektion.

Betrachtet man nicht nur die bereits angesprochene Forderung (F4), sondern auch die ande-ren, so erkennt man, dass nicht alle vier Forderungen bei den vorgestellten Implementierungs-konzept des Autoencoders erfüllt sind. Zwar wird der Autoencoder mit den Snapshot-Datentrainiert (F1) und das Training selber erfolgt – wie klassisch für Neuronale Netze – mit nume-rischen Optimierungsverfahren (F2) wie der Fehlerrückübertragung, wodurch die Abweichungzur Identitätsabbildung minimiert wird. Die Forderung (F3) ist bei einer simplen Umsetzungdes Autoencoder jedoch nicht gegeben. Schon allein aufgrund der Symmetrie und der vollstän-digen Vernetzung der fünf Schichten könnten die Neuronen der Flaschenhalsschicht (zusam-men mit den zugehörigen Gewichten) vertauscht werden, ohne die Fehlerfunktion, die durchdas KNN minimiert wird, zu verändern. Daher können die Koeffizienten unter Verwendung dervorgestellten Berechnungsmethode nicht geordnet sein. An dieser Stelle können jedoch die in[102] vorgestellte Erweiterung des Autoencoders um hierarchische Fehlerfunktionen genutztwerden. Hierdurch werden die Neuronen der Flaschenhalsschicht unterschiedlich gewichtetund gegebenenfalls untereinander vertauscht [101] um eine Sortierung der Merkmale und da-mit auch der Basisfunktionen zu erzwingen. Auf diese Weise arbeitende Autoencoder werdenauch hierarchische Autoencoder genannt. Daher kann durch die Verwendung hierarchischerAutoencoder auch die Forderung (F3) erfüllt werden. Damit können durch Künstliche Neu-ronale Netze alle geforderten Eigenschaften realisiert werden.

Im Zusammenhang mit Künstlichen Neuronalen Netzen und ihrer Optimierung sind nochzwei weitere zentrale Fragen [63] zu diskutieren: Die Initialisierung des KNN und die Wahlder Anzahl an Neuronen in den verschiedenen Schichten. Bezüglich der Neuronenanzahl sinddie Ein- und Ausgangsneuronen durch die vorangegangenen Überlegungen zu Nt festgelegt.Da die Neuronen der Flaschenhalsschicht der Anzahl der Zustände der berechneten Basis-funktionen entspricht, ist die Neuronenanzahl dieser Schicht ein entscheidender Parameter.Um eine sinnvolle Wahl für diese Neuronenanzahl zu tätigen, bietet es sich analog zu deniterativen Verfahren an, die Ergebnisse einer vorangegangenen POD zu verwenden um überMaße wie den RIC eine geeignete Größenordnung zu bestimmen. Im Gegensatz zu Metho-den wie der Sammon-Projektion, wo durch die fehlende Sortierung diese Zahl im Nachhineinnicht reduziert werden konnte, ist dies durch die hierarchische Fehlerfunktion möglich. Es istdaher naheliegend, zunächst die Anzahl der Flaschenhalsneuronen gleich einem guten Wertfür das RIC zu wählen und im Anschluss durch Analyse der hierarchischen Fehlerfunktion dieunwichtigeren Basisfunktionen zu verwerfen. Für die Neuronen in der Zwischenschicht sindsolche systematischen Ansätze nicht direkt verfügbar. In der Praxis werden hier oft Neuro-nenanzahlen gewählt, die nicht sonderlich geringer als die der Eingangsschicht sind, um demKNN genügend Freiheitsgrade zur Optimierung einzuräumen.

53

Page 66: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

Bei der Wahl der Neuronenanzahl in der Flaschenhalsschicht wurden bereits Resultate einervorgeschalteten POD verwendet. Deshalb ist es naheliegend, die Basisfunktionen der PODauch zur Initialisierung des Autoencoders zu nutzen, wie dies auch für die iterativen Verfahrenumgesetzt wurde. Im Gegensatz zur Sammon-Projektion ist die Umsetzung dieser Initialisie-rung weit weniger klar, da durch die Zwischenschicht mehr Gewichte existieren, wodurchzusätzliche Freiheitsgrade entstehen. Wie bei den Überlegungen zur Berechnung der Basis-funktionen aus dem KNN dargestellt, ergeben sich die Basisfunktionen durch das anlegen derSnapshot-Daten. Daher sollte, wenn die Aktivierungsfunktionen f1 bis f3 für die Eingangs-bis Flaschenhalsschicht gewählt werden, eine Initialisierung über die POD die Gleichung

f3(W 2 · f2

(W 1 · f1 (vj)

))= Φ(xj) (4.11)

erfüllt sein. Hier ist vj wie bereits zuvor der j-te adjungierte Snapshot. Abhängig von denAktivierungsfunktionen existieren zahlreiche Möglichkeiten, die Matrizen W 1 und W 2 zuwählen. Zu beachten ist zudem, dass durch unterschiedliche Wahlen der Wichtungsmatrizendas KNN in Bereichen unterschiedlicher Nichtlinearität initialisiert wird. Nimmt man bei-spielsweise an, dass f1 und f3 linear sind, so ist die Nichtlinearität der Initialisierung davonabhängig, ob W 2 · f1 (vj) in einem Bereich liegt, indem f2 stark nichtlinear ist oder nicht.Aufgrund dieser Überlegungen scheint es sinnvoll, die uneindeutige Initialisierung von einemzusätzlichen Einstellparameter abhängig zu machen, der in einer Form gewählt wird, dass erintuitiv als Grad der Nichtlinearität der Initialisierung gedeutet werden kann. Dies kann zumBeispiel für den Fall, dass f1 und f3 gleich der Identität sind und f2(x) ≈ x für kleine x gilt,wie folgt umgesetzt werden: Aus (4.11) folgt unter den obigen Annahmen und Verwendungder Beziehung (3.25) sowie der Annahme Standardmittelwertbildung die Gleichung

W 2 · f2(W 1 · vj

)= Φ(xj) = 1

NtΛ−1

(ATvj

), (4.12)

wobei Λ die Diagonalmatrix bezeichnet, die die Eigenwerte λ der POD auf der Diagonalenenthält. Da f2(x) ≈ x für kleine x gilt, können die Matrizen W 1 und W 2 als Zerlegung derMatrix M = 1

NtΛ−1AT gewählt werden. Um die Nichtlinearität hier adäquat bewerten zu

können, ist es bei Wahl der Zerlegung besonders wichtig, die Größe der Matrix W 1 steuernzu können. Damit dies mit einem einzelnen Einstellparameter gezielt umgesetzt werden kann,wird in dieser Arbeit vorgeschlagen, eine QR-Zerlegung von MT = Q ·R in die Matrizen Qund R vorzunehmen. Hierbei ist Q orthogonal, woraus folgt, dass die Eigenwerte von Q alleden Betrag 1 haben, und R eine obere Dreiecksmatrix. Durch die betragsmäßige Festlegungder Eigenwerte von Q zu 1 ist diese normiert. Wählt man nun die Zuordnung

W 1 = δQT , W 2 = 1δRT , δ ∈ R (4.13)

so ist für hinreichend kleine δ Gleichung (4.12) näherungsweise erfüllt. Die QR-Zerlegungwurde dabei für MT statt für M durchgeführt, um die orthogonale Matrix Q der Wich-tungsmatrix W 1 zuordnen zu können. Dieses Verfahren ermöglicht es, für kleine Werte von

54

Page 67: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.1 Nichtlineare Modellreduktion

δ das Künstliche Neuronale Netz im linearen Bereich über die POD zu initialisieren. Erhöhtman den Parameter δ, so wird (4.12) schlechter erfüllt, sofern f2 für größere Eingänge stärkervon der Identität abweicht. Dies entspricht damit aber gleichzeitig einer verstärkt nichtli-nearen Initialisierung des Netzes, da Änderungen in den Wichtungsmatrizen sich zunehmendnichtlinear auf die Ausgänge der Neuronen auswirken. Durch das systematische Vorgehen derQR-Zerlegung konnte die Stärke der Nichtlinearität dabei einem einzelnen skalaren Parameterzugeordnet werden. Die Vorteile der intuitiven Handhabung und zugängigen Analyse raubendabei aber natürlich auch enorme Freiheitsgrade der Initialisierung, da weitaus mehr Mög-lichkeiten bestehen, die Matrix M zu zerlegen und (4.12) zu erfüllen. Die Auswirkungen desParameters δ auf die Ergebnisse der Modellreduktion werden im Rahmen der Ergebnisdiskus-sion in Abschnitt 7 vertieft.

4.1.5 Reduktion mittels graphenbasierter Verfahren

Die bisher exemplarisch für iterative Verfahren und KNNs vorgestellten Verfahren der Sammon-Projektion und des Autoencoders versuchten beide einen globalen Fehler über die gesamtenSnapshot-Daten zu minimieren und gehören damit zu den abstandserhaltenden Dimensions-reduktionsverfahren. Betrachtet man jedoch die Eigenschaften von Mannigfaltigkeiten, soerkennt man, dass das Verwenden von euklidischen Abständen zwischen allen verfügbarenDatenpunkten nicht unbedingt dem Abstand auf der einbettenden Mannigfaltigkeit entspre-chen muss. Hierzu zeigt Abbildung 4.3 eine einfache Visualisierung einer Mannigfaltigkeitsowie die euklidischen Abstände zwischen zwei Datenpunkten und den Abstand auf der Man-nigfaltigkeit selber. Die Abstände auf der Mannigfaltigkeit werden dabei auch als geodätischerAbstand bezeichnet. Das zugehörigen Kurvenstück heißt Geodäte.

Mannig-faltigkeit

Punkt A

Punkt B

euklidischerAbstand

geodätischerAbstand

Abbildung 4.3: Euklidische Abstände und geodätische Abstände auf einer Mannigfaltigkeit

Durch die gekrümmte Struktur der Mannigfaltigkeit entspricht offensichtlich der euklidischeAbstand nicht mehr dem geodätischen Abstand zweier Datenpunkte auf der Mannigfaltigkeit.Da die Mannigfaltigkeit, auf welcher sich die Datenpunkte befinden, die in ihrer Dimension

55

Page 68: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

reduziert werden sollen, in der Regel zuvor nicht bekannt sind, ist auch der geodätische Ab-stand nicht bekannt. Der Abstand zwischen einem Punkt A und einem Punkt B kann jedochanschaulich gut dadurch angenähert werden, dass einfach die euklidischen Abstände von be-nachbarten Datenpunkten aufsummiert werden, die eine Kette von Nachbarn von Punkt A hinzu Punkt B bilden. Wird diese Summe über die kürzeste Nachbarschaftsverbindung gebildet,erhält man eine gute Approximation des geodätischen Abstandes. Dieses Vorgehen ist abernur möglich, wenn die durch die verfügbaren Datenpunkte gebildete Untermannigfaltigkeit inder tatsächlich einbettenden Mannigfaltigkeit geodätisch konvex ist. Diese Forderung bedeu-tet anschaulich, dass die Datenpunkte so verteilt sind, dass keine Löcher oder Risse entstehen,die in der eigentlichen Topologie nicht enthalten sind. Die Approximation des geodätischenAbstandes und die Einschränkung der geodätischen Konvexität sind in Abbildung 4.4 visuali-siert. In der Praxis sind die Datenpunkte meist geodätisch konvex [122].

geodätischerAbstand

Datenpunkte ohnegeodätische Konvexität

Approximation

Datenpunkte mitgeodätischer Konvexität

Abbildung 4.4: Approximation des geodätischen Abstands und geodätische Konvexität

Offen ist bei dieser Argumentation jedoch noch geblieben, auf welche Weise einerseits dieNachbarschaft von Punkten festgestellt wird und andererseits wie die angesprochenen kür-zeste Nachbarschaftsverbindung gebildet wird. Die zweite Frage entspricht der Suche deskürzesten Pfades in einem Graphen und kann über graphenmethodische Algorithmen wie bei-spielsweise den Dijkstra-Algorithmus [32] bestimmt werden. Entsprechend werden die Nach-barschaftsbeziehungen in einen Graphen überführt. Ein Graph ist hierbei wie folgt definiert[63]:

Definition 9 Ein Graph ist ein Paar G = (V ,E) bestehend aus einer endlichen Menge Vvon Knoten und einer endlichen Menge von Kanten E ⊂ V × V .

Die im vorangegangenen Abschnitt diskutierten Künstlichen Neuronalen Netze sind Graphen,bei welchen die Knoten die Neuronen sind und die Verbindungen samt Gewichten die Kanten.KNNs sind zudem gerichtete Graphen, was bedeutet, dass jede Kante e = (u, v) den Knotenu mit dem Knoten v verbindet aber nicht zwingend umgekehrt. Für die graphenbasierten

56

Page 69: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.1 Nichtlineare Modellreduktion

Dimensionsreduktionsverfahren werden im Graphen die Nachbarschaftsbeziehungen zwischenden Snapshot-Daten dargestellt. Hierbei sind die Snapshot-Daten die Knoten, welche genaudann durch eine Kante verbunden sind, wenn die beiden Datenpunkte Nachbarn sind. Dawenn u ein Nachbar von v ist sinnvollerweise auf v ein Nachbar von u ist, sind diese Graphenungerichtet, was bedeutet, dass wenn e = (u, v) eine Kante ist, auch e = (v,u) eine Kanteist. Graphen mit ihren Kanten lassen sich in einer Matrix darstellen. Ist N dabei die Anzahlder Knoten, so kann E als eine N×N -Matrix verstanden werden, die als Elemente 1 enthält,wenn eine Kante vorliegt, und den Wert 0, wenn keine Kante existiert. Diese Matrix wird auchals Adjazenzmatrix bezeichnet. Werden den Kanten des Graphen nun Gewichte zugeordnet(beispielsweise die konkreten Abstände im Falle einer Nachbarschaft beider Punkte), so wirdvon einer verallgemeinerte Adjazenzmatrix oder eine Gewichtungsmatrix W gesprochen, fürwelche hier aufgrund der Ähnlichkeit dasselbe mathematische Symbol wie für die Wichtungs-matrizen der KNNs verwendet wird.

Die WichtungsmatrixW kann als Form der Speicherung oder der Repräsentation des Graphenals Matrix verstanden werden. Für die Beantwortung der Fragestellung, ob zwei Punkte nunNachbarn sind oder nicht, gibt es aus dem Fachbereich der Dimensionsreduktion vor allemzwei etablierte Verfahren – die k-Nachbarn und die ε-Methode. Bei den k-Nachbarn werdendabei jedem Punkt die k Punkte, welche den kürzesten Abstand zu ihm haben, als Nach-barn zugeordnet. Bei der ε-Methode wird hingegen ein Grenzwert ε festgelegt. Alle Punkte,deren Abstand untereinander kleiner als ε ist, gelten dann als Nachbarn. Unter beiden Verfah-ren ist bei einer ungleichen Abtastung der Daten das k-Nachbarn-Verfahren zu bevorzugen,weil die ε-Methode hier ungleiche Nachbarschaftsdichten hervorruft, die in der tatsächlichMannigfaltigkeit jedoch nicht gegeben sind [122]. Die Werte für ε und k sind zusätzliche Ein-stellparameter jeder graphenbasierten Methode. Ihre Wahl hängt stark von den untersuchtenDatensätzen ab, wodurch sie von Anwendungsfall zu Anwendungsfall neu bestimmt werdenmüssen. Auf Basis der Nachbarschaftsdefinition und der Adjazenzmatrix sind zahlreiche Di-mensionsreduktionsverfahren möglich. Bekannt sind hier neben anderen Verfahren die Isomapund die Laplacian Eigenmaps.

Bei dem Verfahren der Isomap [108], [113] wird die in Abbildung 4.3 und 4.4 visualisierteApproximation der geodätischen Abstände über euklidische Abstände der Nt Snapshots un-tereinander verwendet. Berechnet man mit dem Dijkstra-Algorithmus den kürzesten Abstanddij der Punkte i und j innerhalb des Graphen, so kann man den sogenannten Isomap-Kern

G = −12HDH ∈ RNt×Nt mit Dij = d2

ij und H = I − 1NtE, (4.14)

wobei I die Einheitsmatrix und E die Matrix mit Eij = 1∀i, j ist, definieren. Nun kann manmathematisch zeigen, dass der Isomap-Kern G als Gramsche Matrix wichtige Informationenüber die Topologie der Mannigfaltigkeit enthält und es daher sinnvoll ist, die Eigenvektorenvon G zur Dimensionsreduktion zu verwenden. Die Grundidee ist es dabei, die geodätischenAbstände zum Erfassen der Topologie der Mannigfaltigkeit zu nutzen.

57

Page 70: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

Ein verwandtes aber doch unterschiedliches Vorgehen liegt bei den Laplacian Eigenmaps [9]vor. Hier ist die Hauptidee bezüglich der Mannigfaltigkeiten nicht die Berücksichtigung dernicht-euklidischen Abstände – worauf die Isomap aufbaut – sondern die Tatsache, dass Man-nigfaltigkeit nur lokal einen euklidischen Raum widerspiegeln. Daher ersetzen die LaplacianEigenmaps den globalen quadratischen Fehler der PCA durch einen lokalen quadratischenFehler. Der lokale Fehler wird dabei über die im Graphen gespeicherten Nachbarschaftsbe-ziehungen definiert. Sei dazu f die gesuchte nichtlineare Dimensionsreduktions-Abbildung,die die Snapshots vi auf die dimensionsreduzierten Vektoren f(vi) = ri ∈ RN abbildet.Die Dimension des reduzierten Raums N ist zunächst frei. Die Gesamtheit der dimensions-reduzierten Vektoren für alle Snapshots kann als Matrix r ∈ RNt×N gefasst werden. Diesedimensionsreduzierten Vektoren entsprechen dabei nicht der Projektion der Snapshots auf dieBasisfunktionen wie in (4.6), da diese im selben Raum wie die Snapshots liegen. Die Lapla-cian Eigenmaps fordern nun, dass Datenpunkte, die vor der Dimensionsreduktion (das heißtdie vi) Nachbarn waren auch nach der Projektion (das heißt in ri) Nachbarn sein sollen.Unter Verwendung einer allgemeinen Metrik d(x, y) wird dazu die Gewichtungsmatrix W inAbhängigkeit der Metrik d und des Einstellparameters δ zu

Wij =

e−d(vj ,vi)2

δ für Nachbarn0 sonst

(4.15)

berechnet. Diese Wichtungsmatrix wird in Anlehnung an die Wärmeleitungsgleichung auch als’heat kernel’ bezeichnet. Für eine Wahl von δ →∞ ergibt sich dabei eine Wichtungsmatrix,die identisch zur Adjazenzmatrix ist. Über die Wichtungsmatrix kann das Erhaltungsziel derLaplacian Eigenmaps als Optimierungsproblem

minr

∑i,j‖ri − rj‖2Wij (4.16)

geschrieben werden. Das Optimierungsproblem ist im Gegensatz zur POD in (6) nicht fürdie Basisfunktionen, sondern für die dimensionsreduzierten Vektoren formuliert. Die Wich-tungsmatrixW sorgt dafür, dass stark bestraft wird, falls Punkte, die zuvor (vi) benachbartwaren nach der Abbildung in den niedrigdimensionalen (ri) einen großen Abstand besitzen.Als Norm wird die übliche euklidische Norm verwendet. Ohne weitere Nebenbedingungen istdieses Optimierungsproblem jedoch nicht sinnvoll, da man den Fehler in (4.16) einfach da-durch zu Null setzen kann, indem man alle Snapshots auf genau einen Datenpunkt abbildet.Daher wird als Nebenbedingung das Erfüllen der Gleichung

rTDr = I mit Dii =∑j

Wij (4.17)

gefordert. Diese sorgt dafür, dass die Abbildung f keine Dimensionen unterschlägt, das heißt,dass r den Rang N hat. Durch das Bilden der Ableitung kann einfach gezeigt werden, dass

58

Page 71: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.1 Nichtlineare Modellreduktion

die Lösung r des Optimierungsproblems mit Nebenbedingung (vergleiche auch Abschnitt 5)die das generalisierte Eigenwertproblem

(D −W )r = λDr (4.18)

erfüllt. Die N Eigenwerte λ sind, da D−W positiv definit ist, ebenfalls positiv. Da es sich –im Gegensatz zu Maximierungsproblems der POD in (6) – um ein Minimierungsproblem han-delt, müssen die Eigenvektoren zu den kleinsten Eigenwerten λ zur Lösung der Optimierunggewählt werden. Ein Eigenwert ist dabei identisch Null, da für den nur aus Einsen bestehen-den Vektor 1 die Rechnung (D−W )1 = 0 gilt. Dieser Eigenvektor kann als translatorischeVerschiebung aller Snapshots durch die Abbildung f verstanden werden, die die Abstände derPunkte untereinander nicht beeinflusst. Dies sorgt dafür, dass das Optimierungsproblem nichteindeutig gelöst werden kann. Daher sind die besten niedrigdimensionalen Repräsentanten derSnapshots die Eigenvektoren zu den kleinsten echt positiven Eigenwerten. Diese Vektoren rientsprechen nun aber genau den (nichtlineare bestimmten) zeitabhängigen Koeffizienten Ai,da sie den Snapshot-Daten zu jedem Zeitpunkt einen passenden niedrigdimensionalen Zu-stand zuordnen. Für die Laplacian Eigenmaps gibt es zudem Analysen [9], die analog zumVerhältnis der POD mit der PCA die Verwendung der Eigenmaps für PDE-Systeme zusätzlichrechtfertigt. Konkreter kann gezeigt werden, dass der Operator D −W für den Grenzüber-gang von unendlich vielen Datenpunkten unter nicht zu einschränkenden Annahmen gegenden sogenannten Laplace-Beltrami-Operator konvergiert.

Beide graphenbasierten Verfahren sind in der präsentierten Form bereits derart formuliert, dasssie die Koeffizienten A anstelle der Basisfunktionen berechnen. Dies hat den zusätzlichen Re-chenvorteil, dass der Graph Nt Knoten anstellen von Nx Knoten, die für die Bestimmungvon Φ benötigt würden, besitzt. Dementsprechend sind die untersuchten Matrizen allesamtvon der Dimension Nt × Nt und es müssen nur vergleichsweise kleine Eigenwertproblemegelöst werden. Dieser Ansatz ist nicht nur für die beiden repräsentativ vorgestellten Verfahrender Isomap und der Laplacian Eigenmaps zulässig, sondern lässt sich ebenso für alle gängi-gen graphenbasierten Verfahren, die zur Dimensionsreduktion eingesetzt werden, verwenden.Analysiert man die vier aufgestellten Forderungen, so basieren sowohl die Isomap als auch dieLaplacian Eigenmaps auf Snapshot-Daten (F1), die dazu genutzt werden, die Koeffizienten(F4) zu berechnen. Durch die Lösung eines Optimierungsproblem (F2), die durch entsprechen-den Eigenwertprobleme gelöst werden, liegt ebenfalls eine Sortierung (F3) der Koeffizientenvor, da diesen – analog zur PCA – über den zugehörigen Eigenwert ein gewisser Informati-onsgehalt zugeordnet werden kann. Als zusätzliche Einstellparameter ergeben sich bei beidenVerfahren die Wahl der Nachbarschaftsbeziehungen Dies gilt sowohl für die SMethode (k-Nachbarn oder ε-Methode) als auch die zu wählenden Parameter für k beziehungsweise ε. Beiden Laplacian Eigenmaps ergibt sich als zusätzliche Einflussgröße der Parameter δ, der zurKonstruktion der Gewichtungsmatrix verwendet wird. Hierfür liegt jedoch durch den Grenz-wertübergang zur Adjazenzmatrix für δ →∞ ein erster Ansatz für die Parameterwahl vor: δsollte zu anfangs hinreichend hoch initialisiert werden.

59

Page 72: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

Zusammenfassend für alle drei vorgestellten Verfahren wurde ausgeführt, dass algorithmischverschiedensten Verfahren sich dadurch konsistent in eine einheitliche Struktur zur Modell-reduktion einbetten lassen, dass – geleitet von den aus den POD-Eigenschaften abgeleitetenForderung (F1) bis (F4) – die Verfahren dergestalt formuliert werden, dass als zentraler Punktdie Koeffizienten anstelle der Basisfunktionen ermittelt werden. Dies ermöglicht nicht nur dieÜbernahme günstiger Eigenschaften der POD für Strömungsprozesse, sondern geht auch ein-her mit einer signifikanten Ersparnis von Rechenzeit. Damit liegt eine generell einsetzbareStruktur zur nichtlinearen Modellreduktion für Strömungsprozesse vor.

4.2 Interpolation reduzierter Modelle

Alle bisher aufgeführten Verfahren basieren – inspiriert vom Ansatz der POD – auf der Ver-wendung von Snapshot-Daten. Wie bereits in Abschnitt 3.2.5 ausgeführt, kann die Modell-reduktion über Daten nur dann gelingen, wenn diese Daten die wesentliche Dynamik desProzesses enthalten. Bei der hoch aufgelösten Simulation für Strömungsprozessen ist es aberoftmals nicht möglich, derartige Datensätze für den gesamten Arbeitsbereich, der später vondem Regler, der auf den reduzierten Modellen aufbaut, abgedeckt werden soll, zu erstellen.Stattdessen liegen bei praktischen Anwendungen die Simulationsdaten als separate Daten-sätze nur für ausgewählte Arbeitspunkte und Betriebsbereiche vor. In einer solchen Situationstehen zwei Wege offen, ein reduziertes Modell zu erstellen: Zum einen können alle Daten-sätze verwendet werden, um ein Modell für den gesamten Arbeitsbereich zu erstellen; zumanderen kann für jeden Datensatz (und damit jeden Arbeitspunkt) ein eigenes reduziertesModell erstellt werden.

Im ersten Fall des gesamten Modells treten einige schwerwiegende Nachteile zutage. Wirddie Modellreduktion für nichtlineare Systeme durchgeführt, so ist insbesondere für die PODbekannt, dass sich diese hier als nicht robust herausgestellt hat [107]. Wie im Stand derTechnik 1.2 bereits dargelegt wäre es daher nicht angezeigt anzunehmen, dass das auf Basisder Daten der verschiedenen Arbeitspunkte erstellte Modell auch für den Bereich zwischenden Arbeitspunkten gelten sollte. Zusätzlich spricht ebenfalls gegen die Verwendung einesGesamtmodells, dass dieses bei (für nichtlineare Strömungsprozesse) zu erwartenden dyna-mischen Unterschieden zwischen den Arbeitspunkten sämtliche dieser Dynamiken in einemModell vereinen sollte. Daher wird das Gesamtmodell wahrscheinlich entweder zu komplex(bei Berücksichtigung aller Dynamiken) oder zu ungenau über den gesamten Arbeitsbereich.Zur Visualisieren dieses Verhaltens zeigt Abbildung 4.5 die erste der mittels POD ermitteltenBasisfunktion der Burgersgleichung für verschiedenen Viskositäten. Es ist klar erkennbar, dassdiese unterschiedliche dynamische Profile symbolisieren und eine Robustheit oder ein Abde-cken ihren vereinigten Bandbreite in einem Gesamtmodell nicht realistisch erwartet werdenkann.

Möchte man diese Nachteile umschiffen und greift daher auf einzelne Modelle für die ein-zelnen Arbeitspunkte zurück, so tritt der letztgenannte Zielkonflikt nicht derart stark auf,

60

Page 73: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.2 Interpolation reduzierter Modelle

0 0 2, 0 4, 0 6, 0 8, 1−0 12,

−0 08,

−0 04,

0

0 04,

0 08,

x

ji(t)

Abbildung 4.5: Erste POD-Basisfunktion der Burgersgleichung für verschiedene Viskositäten

da jedes Modell nur die Dynamik eines einzigen Arbeitspunktes erfassen muss. Nichtsde-stoweniger stellt sich die Frage, wie bei einzelnen Modellen für einzelne Arbeitspunkte eineAussage über die Dynamik zwischen diesen Arbeitspunkten getroffen werden kann. Das simpleHin- und Herschalten zwischen den Modellen wirkt in Anbetracht des bereits aufgeführtenRobustheit-Argumentes als unzulänglich. Stattdessen scheint es sinnvoller, zwischen den ein-zelnen Modelle zu interpolieren, um ein reduziertes Modell für die Bereiche zwischen denArbeitspunkten zu ermitteln. Da die reduzierten Modelle jedoch wie die Strömungsprozesseselber nichtlinear sind, müssen angepasste Methoden untersucht werden, die eine sinnvolleInterpolation der Modelle liefern.

4.2.1 Struktur der Modellinterpolation

Als erläuterndes Beispiel für die hier vorgeschlagene Struktur dient erneut die Burgersglei-chung. Gemäß (3.11) und (3.12) besitzt das reduzierte Modell der Burgersgleichung dieStruktur

a = aeqae + µLae + gu

mit Vektoren, Matrizen und Tensoren, die sich über ϕ und das Skalarprodukt berechnenlassen. Daher ist das Galerkin-Modell durch q, L und g gegeben. Seien nun A und B zweiArbeitspunkte, für welche über Snapshots die Basisfunktionen ϕA und ϕB bestimmt wurden,und C = 1

2(A + B) ein weiterer Arbeitspunkt, für den keine Daten vorliegen. Würde mannun die Größen q

Abis gB über ϕA und ϕB bestimmen, so wäre ein sehr simpler Ansatz

zur Modellreduktion qC

= 12(q

A+ q

B) und so weiter zu wählen. Während dieses Vorgehen

im Linearen eine gewisse Berechtigung besitzt, so wird es bei den nichtlinearen Termen qim Allgemeinen scheitern. Stattdessen ist es sinnvoller, die Basisfunktionen zu interpolieren

61

Page 74: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

und die Nichtlinearität der Modelle in der Galerkin-Projektion mitzuberücksichtigen. Es wirdalso

ϕC = interpl (ϕA,ϕB,A,B) (4.19)

berechnet und das interpolierte Galerkin-Modell zu

qijk = −〈ϕ(i)C (x) · ∂ϕ

(j)C

∂x(x),ϕ(k)

C (x)〉L2

Lik = 〈∂2ϕ

(i)C

∂x2 ,ϕ(k)C (x)〉L2

gi = −〈ϕN+2C (x)),ϕ(k)

C (x)〉L2

ermittelt. Die Berechnung des Galerkin-Modells aus der Basisfunktion ϕC ist in Echtzeitrealistisch möglich. Denn (unter Verwendung des Gauß-Tricks) muss ϕC lediglich einmal nu-merisch abgeleitet werden und im Anschluss numerisch ein paar Integrale gelöst werden. Dadie Anzahl der zu berechnenden Integrale quadratisch mit der Anzahl der Basisfunktionenwächst, gilt dies nur für eine hinreichend kleine Anzahl an Basisfunktionen. Die Interpolationkann daher bei nicht zu großen reduzierten Modellen online verwendet werden, um das Modellan den aktuellen Arbeitspunkt anzupassen, sofern die Ermittlung von ϕC hinreichend schnellmöglich ist. Sie kann auch offline durchgeführt werden, um ohne die Notwendigkeit weitererSnapshot-Daten reduzierte Modelle für andere Arbeitspunkte zu berechnen.

Im Rahmen dieser Struktur bleibt die Frage offen, wie die Interpolation der Basisfunktionenvorgenommen werden soll. Hier scheitert die Verwendung einer normalen Interpolation, wiesie beispielsweise für reellwertige Funktionen vorgenommen werden kann. Dies liegt daran,dass die elementweise Summe von Basisfunktionen aus zwei Basen nicht zwingend eine Basisderselben Dimension ergibt. Dazu zeigt Abbildung 4.6 ein einfaches Gegenbeispiel.

+ =

Basis 1 Basis 2 Basis mit DimensionsverlustAbbildung 4.6: Elementweise Summe von zwei Basisfunktionen mit Dimensionsverlust

Zu diesem Phänomen gibt es zwei Sichtweisen, welche dieses erklären. Zum einen scheitert dieelementweise Summe daran, dass die beiden Basisfunktionen nicht aneinander ausgerichtet

62

Page 75: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.2 Interpolation reduzierter Modelle

sind. Hierdurch kommt es durch die wechselnden Vorzeichen dazu, dass die simple Interpo-lation scheitert. Die Lösung des Problems führt in dieser Sichtweise darauf, die Basen vorder elementweisen Summation aneinander auszurichten. Zum anderen kann das Scheitern derInterpolation damit begründet werden, dass die Menge der orthogonalen Matrizen (welchedie Basisfunktionen ja sind) keinen linearen Raum bildet, sondern eine Mannigfaltigkeit. DieseSichtweise offeriert als Lösung, die Interpolation auf der passenden Mannigfaltigkeit durchzu-führen.

Für beide Sichtweisen gibt es Vorarbeiten, die bereits im Stand der Technik 1.2 aufgeführtwurden. Der Weg der Mannigfaltigkeiten wird insbesondere in den Arbeiten von Amsallem in[2] und [3] untersucht. In diesen wird ein Verfahren zur Interpolation von orthogonalen Basenvorgestellt, das auf dem Konzept von Mannigfaltigkeiten fußt. Im Gegensatz dazu verwen-det Borggaard in [15] ein Ausrichten der Basisfunktionen, Interpolieren und nachfolgendesOrthonormalisieren. Der Beitrag dieser Arbeit im Vergleich zu den Vorarbeiten ist erstensdie Kombination dieser Verfahren mit der Galerkin-Projektion wie bereits weiter oben erläu-tert und zweitens die Erweiterung der Interpolation von Amsallem und Borggaard, so dassvariantenreichere Interpolationsverfahren möglich werden. Konkret wird dies bei Borggaarddurch ein Generalisieren des Interpolationsschemas und bei Amsallem durch die Nutzung vonBézier-Kurven auf Mannigfaltigkeiten erreicht.

4.2.2 Interpolation über Mannigfaltigkeiten

Die berechneten (diskretisierten) Basisfunktion Φ spannen einen N -dimensionalen Unterraumdes RNx auf. Für die Qualität des reduzierten Modells ist nicht die konkrete Wahl der Ba-sisfunktionen, sondern der durch sie aufgespannte Unterraum entscheidend. Dies entsprichtbei der POD der Vorstellung, dass für die Modellreduktion die Wahl der Hyperebene, aufwelche projiziert wird, entscheidend ist, während die Parametrierung der Ebene nicht wesent-lich ist. Im Falle der POD enthält die Parametrierung über den RIC nur eine Gewichtung derWichtigkeit der Richtungen innerhalb der Ebene selber, verändert die Qualität der gesamtenModellreduktion jedoch nicht, sobald die Anzahl der Basisfunktionen fixiert ist. Aus Sicht derMannigfaltigkeiten entsteht der beschriebene Interpolationsfehler nun dadurch, dass durch dieBasisfunktionen für die Interpolation willkürliche Repräsentanten dieser Unterräume verwen-det werden, statt die Unterräume selber zu interpolieren. Die Menge der N -dimensionalenUnterräume des RN§ ist die sogenannte Graßmann-Mannigfaltigkeit G (N ,Nx) [58]. Auf Man-nigfaltigkeiten kann dabei wie folgt interpoliert werden [2]:

Bei einer (differenzierbaren Riemann-)Mannigfaltigkeit M kann in jedem Punkt x0 auf Mein Tangentialraum T Mx0 gebildet werden. Dieser hat dieselbe Dimension wie die Mannigfal-tigkeit und beinhaltet alle Vektoren des Rn, die Tangenten der Mannigfaltigkeit in x0 sind.Der Tangentialraum kann dabei als eine spezielle Karte des Atlas verstanden werden, die überdie Jacobi-Matrix Df der Funktion f , die die Mannigfaltigkeit erzeugt, berechnet werdenkann. Da M eine Mannigfaltigkeit ist, gibt es in einer Umgebung von x0 eine Abbildung

63

Page 76: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

vom Tangentialraum auf die Mannigfaltigkeit und umgekehrt. Im Falle des Tangentialraumskann dabei anschaulich jeder Punkt x in der Umgebung von x0 mit der (eindeutigen) kürzes-ten Strecke zwischen x0 und x auf der Mannigfaltigkeit identifiziert werden. Diese kürzesteStrecke γ(x0,x) wird Geodäte genannt. Die angegebene Notation zeigt dabei an, dass dieGeodäte von x0 nach x verläuft. Der Geodäten γ(x0,x) kann wiederum über die Karten-Abbildung ein Element in T Mx0 zugeordnet werden. Anschaulich stellt dies die Richtung undGeschwindigkeit dar, mit der man aus dem Punkt x0 loslaufen müsste, um nach einer fest-gelegten Zeit den Punkt x zu erreichen. Die Abbildung vom Tangentialraum auf die Geodäteheißt Exponentialabbildung x = Expx0 (γ(x0,x)) und die Umkehrabbildung LogarithmischeAbbildung γ(x0,x) = Logx0 (x).

Im Falle der Basisinterpolation stellt jede berechnete Basis einen Punkt auf der Graßmann-Mannigfaltigkeit dar. Liegen diese Punkte nicht zu weit voneinander entfernt, so existiereneindeutigen Geodäte zwischen allen Punkten. Eine Interpolation kann nun dadurch erfolgen,dass der Geodäte zwischen den Punkten nur ein Stück weit gefolgt wird, wie in Abbildung4.7 anhand der Sphäre als Mannigfaltigkeit visualisiert. In dem dort dargestellten Fall würdevon der Geodäte zwischen x = 1 und x = 3 zur Interpolation von x = 2, 4 nur 1,4

2 = 70%der Strecke zurückgelegt werden.

x=1x=3

x=5

interpolierterWert für x=2,4

Geodäten

Abbildung 4.7: Interpolation auf Mannigfaltigkeiten am Beispiel der Sphäre

Die konkrete Berechnung der Exponential- und Logarithmischen Abbildung kann [8] entnom-men werden. Da die Menge der orthogonalen N ×Nx-Matrizen mit vollem Rang die Struktureine Prinzipalbündels innerhalb der Graßmann-Mannigfaltigkeit bilden, können beide Abbil-dungen über die Verwendung der Matrizen anstatt der Unterräume selber berechnet werden.Seien dafür Φ und Ψ zwei entsprechende Matrizen. Dann ergibt sich die zur Geodäten gehö-rige Matrix Γ(Φ, Ψ) als

Γ(Φ, Ψ) = LogΦ (Ψ) = U arctan(Σ)V T (4.20)

unter Verwendung der dünnen Singulärwertzerlegung

U ΣV T =(I −Φ ΦT

)Ψ(ΦTΨ

)−1. (4.21)

64

Page 77: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.2 Interpolation reduzierter Modelle

Die Umkehrabbildung berechnet sich zu

ExpΦ(Γ(Φ, Ψ)) = Φ V cos (Σ) + U sin (Σ) (4.22)

mit der Singulärwertzerlegung Γ = U Σ V T. Die Funktionen arctan, sin und cos werden da-bei jeweils nur auf die Diagonalelemente von Σ beziehungsweise Σ angewandt. Zu beachtenist hier noch, dass die Orthogonalität der Matrizen Φ und Ψ die gemäß [8] für die Berechnungvorausgesetzt wird, nur dann gleichbedeutend mit der Orthogonalität der Basisfunktionen ist,wenn das Standard-Skalarprodukt verwendet wird. Ansonsten müssen die Basisfunktionen andas hier benötigte Verständnis von Orthogonalität umgerechnet werden.

In der praktischen Umsetzung in Kombination mit der Galerkin-Projektion läuft die Mo-dellinterpolation wie folgt ab: Während der Offline-Phase werden die verschiedenen Basen Φberechnet und gespeichert. Mithilfe der Basen werden über (4.20) die Geodäten und derenSingulärwertzerlegung zwischen allen Punkten berechnet und gespeichert. In der Online-Phasewird der aktuelle Arbeitspunkt (unter der Annahme der Abhängigkeit des Arbeitspunktes vonlediglich einem Parameter) einem Abschnitt zwischen zwei Arbeitspunkten zugeordnet. Derprozentuale Anteil des neuen Arbeitspunktes an der Geodätenstrecke (vergleiche Abbildung4.7) t wird ermittelt. Die neue Basis ergibt sich dann über (4.22) angewendet auf t · Γ.Aufgrund der Eigenschaften der Singulärwertzerlegung können die in der Offline-Phase be-rechneten Matrizen der Singulärwertzerlegung weiter verwendet werden – lediglich Σ mussum t skaliert werden. Die sich neu ergebende Basis wird dann für die Galerkin-Projektionverwendet. Der Rechenaufwand während der Online-Phase ist überschaubar, da die meistenaufwändigen Berechnungen offline durchgeführt werden konnten. Die interpolierte Basis ergibtsich über

Φneu = cos(t)Φ V cos (Σ) + sin(t)U sin (Σ), (4.23)

wovon außer t alle Ausdrücke vorher bekannt sind und offline berechnet werden können.

Dieses Interpolationsschema folgt strikt den Geodäten auf der Graßmann-Mannigfaltigkeit.Das hat zur Folge, dass immer nur die zwei benachbarten Punkte zur Interpolation herange-zogen werden. Weiterhin ist die interpolierte Kurve, die aus den einzelnen Geodäten zusam-mengesetzt ist, in den Arbeitspunkten selber nicht glatt, wie auch in Abbildung 4.7 erkennbarist. Als Verbesserung des Interpolationsverfahrens können glatte Bézier-Kurven auf der Man-nigfaltigkeit definiert werden. Die Konstruktion dieser Kurven auf Riemann-Mannigfaltigkeitenwird in [40] untersucht. Eine Bézier-Kurve β(τ) mit τ ∈ [0, 1] vom Grad k ≥ 1 wird dabeidurch k+1 Punkte definiert. Dabei sind der erste und letzte Punkte der Start- beziehungswei-se Endpunkt der Kurve, während der verbleibende k−1 Punkte die (höheren) Ableitungen derKurve im Start-/Endpunkt festlegen. Eine Bézier-Kurve vom Grad 1 ist daher eine Linie, diezwei Punkte verbindet, und entspricht der bereits vorgestellten Interpolation. Bézier-Kurvenvom Grad 2 und 3 werden in Abbildung 4.8 gezeigt. Im Falle eines Grades von 2 werden die

65

Page 78: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

Start- und Endgeschwindigkeiten vS und vE über den Kontrollpunkt P durch vS = P − P1und vE = P2 − P bestimmt. Während hier die beiden Geschwindigkeiten nicht unabhängigvoneinander gewählt werden können, ist dies bei einer Bézier-Kurve von Grad 3 durch dieVerwendung zweier Kontrollpunkte möglich.

Grad 2P1

P

P2

Grad 3P1

P1

P2

P2

vSvE vS

vE

˜ ˜

˜

Abbildung 4.8: Bézier-Kurven vom Grad 2 und 3 im R2 inklusive Kontrollpunkte

Mithilfe von zwei Bézier-Kurven vom Grad 2 und n−2 Kurven vom Grad 3 können n Punkteglatt miteinander verbunden werden. Hierzu werden die ersten zwei und die letzten beidenPunkte über die Kurven vom Grad 2 verbunden. Die anderen Punkten werden dergestalt mitKurven vom Grad 3 verbunden, dass die Start- und Endgeschwindigkeiten aufeinanderfolgen-der Segmente identisch sind. Somit verbleiben die Geschwindigkeiten vi in den Punkten Pifür i = 2, . . . ,n − 1 als freie Parameter. Überträgt man die allgemeinen Berechnungsvor-schriften für Bézier-Kurven auf die Graßmann-Mannigfaltigkeit, so ergeben sich die folgendenSchritte: Zunächst muss ein Skalarprodukt und eine Norm auf der Graßmann-Mannigfaltigkeiteingeführt werden. Analog zum Vorgehen der Geodäten-Berechnung wird auch hier das Prin-zipalbündel verwendet, um die Berechnungen nicht mit Unterräumen, sondern mit Matrizendurchführen zu können. Es bietet sich an, dass Skalarprodukt

〈Φ, Ψ〉GM = spur(ΦT ·Ψ

)(4.24)

zu verwenden, womit sich als induzierte Norm mit ‖Φ‖F =√∑m

i=1∑nj=1 |Φij|2 die bekann-

te Frobeniusnorm ergibt. Die freien Parameter sind als Elemente des Tangentialraums nunMatrizen vi (ebenso wie Γ), die dennoch – als Elemente des Tangentialraums – über dasSkalarprodukt in eine Richtung und eine Länge zerlegt werden können. Nun werden die vifür i = 2, . . . ,n − 1 dadurch bestimmt, dass die Krümmung der Bézier-Kurve minimiertwird. Dies ist eine sinnvolle Forderung, da so ein gleichmäßiger, glatter Verlauf der Kurveohne ungewöhnliche Bäuche erzielt werden kann. Die Richtung di von vi ist dabei durch dieWinkelhalbierende der Geodäten Γ(Pi−1,Pi) und Γ(Pi,Pi+1), das heißt

Γ(Pi+1,Pi)‖Γ(Pi+1,Pi)‖F

− Γ(Pi−1,Pi)‖Γ(Pi−1,Pi)‖F

, (4.25)

gegeben. Die Minimierung der Krümmung führt dann nach einigen Rechnungen im Falle derGraßmann-Mannigfaltigkeit auf das Lösen des linearen Gleichungssystems A · ‖v‖F = c

66

Page 79: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.2 Interpolation reduzierter Modelle

A =

12 3〈d3,d2〉GM 0 . . . 0〈d2,d3〉GM 4 〈d4,d3〉GM

. . . ...0 . . . . . . . . . 0... . . . 〈dn−3,dn−2〉GM 4 〈dn−1,dn−2〉GM0 . . . 0 3〈dn−2,dn−1〉GM 12

c =

〈3Γ(P3,P2)− 2Γ(P1,P2),d2〉GM〈Γ(P4,P3)− Γ(P2,P3),d3〉GM

...〈Γ(Pn−1,Pn−2)− Γ(Pn−3,Pn−2),dn−2〉GM〈3Γ(Pn,Pn−1)− 2Γ(Pn−2,Pn−1),dn−1〉GM

. (4.26)

für ‖v‖F als den Vektor der Längen von vi. Sind die Geodäten Γ(Pi,Pj) bekannt, so könnenRichtung und Betrag der vi ermittelt werden. Für eine Bézier-Kurve vom Grad 2 zwischenP1 und P2 ergibt sich beispielsweise die Gleichung

β(τ) = ExpP2

(Γ(P1,P2)(τ − 1)2 − 2v2τ(1− τ)

). (4.27)

Als Element des Tangentialraums ist die Bézier-Kurve dabei selbst eine Matrix. Die Berech-nung der vi kann in der Offline-Phase erfolgen. Als einziger zusätzlicher Rechenaufwandergibt sich im Vergleich zur einfachen Interpolation, dass durch die Summe innerhalb derExponentialabbildung die Singulärwertzerlegung ebenfalls online durchgeführt werden muss.Diese beschränkt sich jedoch auf eine dünne Singulärwertzerlegung und ist daher bei einergeringeren Anzahl an Basisfunktionen nicht rechenaufwendig, da sie nicht von Nx abhängigist. Zusammengefasst läuft die Interpolation über Mannigfaltigkeiten wie folgt ab:

(1) Berechnen der Geodäte Γ(Φ, Ψ) von Φ nach Ψ.

(1b) Berechnen der Zwischengeschwindigkeiten vi der Bézier-Kurve.

(2) Folgen der Geodäte beziehungsweise Bézier-Kurve

(3) Zurückrechnen auf die interpolierte Basis mittels der Exponentialabbildung.

Der Schritt (1b) ist nur im Falle der Bézier-Kurve notwendig. Eine offline Berechnung ist fürdie Schritte (1) und (1b) möglich. Sofern keine Bézier-Kurve verwendet wird, vereinfacht sichdie Berechnung in (3), da keine Singulärwertzerlegung durchgeführt werden muss.

67

Page 80: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

4.2.3 Interpolation durch Ausrichten

Die Methodik der Modellinterpolation über Mannigfaltigkeiten ist mathematisch stringentund bildet ein schlüssiges Gesamtkonzept. Dennoch stellt sich in Anbetracht dessen, dassdie ursprüngliche Problematik diejenige war, dass Basisfunktionen nicht aneinander ausge-richtet waren, die Frage, ob nicht auch mit einfacheren und zugängigeren Methoden einvergleichbares Ergebnis erreicht werden kann. In [15] löst Borggaard das Ausrichten zweierorthogonaler Basen Φ und Ψ ∈ RNx×N durch den simplen Ansatz, eine Permutationsmatrixzu finden, die dafür sorgt, dass beiden Basen die identischen Vorzeichen haben und die Reihen-folge der Basisfunktionen identisch ist. Dieser Ausrichtung wurde die Standard-Interpolation(1− τ)Φ + τΨ mit τ ∈ [0, 1] und eine Orthonormalisierung nachgeschaltet.

Dieser Ansatz ist nur dann möglich, wenn die Basen sich hinreichend ähnlich sind, dass einVertauschen von Vorzeichen und Reihenfolge ausreicht, um sie aneinander auszurichten. Ineinem solchen Fall sind aber auch die reduzierten Modell allgemein sich sehr ähnlich, weshalbsich die Frage stellt, ob es sich überhaupt lohnt eine Interpolation vorzunehmen. Weichen dieBasen stärker voneinander ab, so reicht eine Permuationsmatrix nicht aus, sondern muss umdie rotatorischen und spiegelnden Elemente einer Kongruenztransformation erweitert werden[3]. Da sich Kongruenztransformationen über orthogonale Matrizen darstellen lassen, ist essinnvoll, die beste Transformation zum Ausrichten der beiden Basen über

arg minT‖Φ ·T −Ψ‖2

F mit T TT = I (4.28)

zu bestimmen, wobei T die gesuchte Transformationsmatrix und ‖ · ‖F erneut die Frobe-niusnorm ist. Das Minimierungsproblem (4.28) ist dabei so formuliert, dass T die Basis Φbestmöglich an Ψ ausrichtet. Nach [3] ist die Lösung des Optimierungsproblem in (4.28) dieMatrix T = U V T mit der Singulärwertzerlegung ΦTΨ = U ΣV T ∈ RN×N . Die bestmög-liche Ausrichtung von Φ an Ψ ist dementsprechend Φ ·T .

Die Verwendung von Kongruenztransformationen statt einer Permutation bedeutet eine Ver-besserung des Verfahrens durch die verallgemeinerte Anwendbarkeit und erhöhte Genauigkeit.Eine weitere Verbesserung im Vergleich zu [15] stellt die verallgemeinerte Interpolationsstrate-gie dar, die im Folgenden erläutert wird: In Abbildung 4.9 sind schematisch zwei Unterräumedargestellt, die durch Φ und Ψ aufgespannt werden. Des Weiteren sind die Projektionen ΦP

und ΨP sowie die komplementäre Projektionen Φ⊥ = Ψ−ΦP und Ψ⊥ = Φ−ΨP gezeigt.

Dabei befindet sich die Projektion ΦP im von Φ aufgespannten Unterraum. Die Projektionkann dabei – wie in Abbildung 4.9 ersichtlich – über das Optimierungsproblem

arg minT‖ΦT −Ψ‖2

F ohne Nebenbedingungen. (4.29)

68

Page 81: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.2 Interpolation reduzierter Modelle

Φ Ψ

ΨPΦP

Ψ⊥ Φ⊥

Abbildung 4.9: Schematische Skizze zweier Unterräume und ihrer Projektionen aufeinander

ermittelt werden. Die Lösung von (4.29) ist über die Pseudoinverse als

T = (ΦTΦ︸ ︷︷ ︸=I

)−1ΦTΨ = ΦTΨ = U ΣV T, (4.30)

gegeben. Hier wird wie zuvor vorausgesetzt, dass die Matrizen orthogonal sind, was durcheine vorgelagerte Orthogonalisierung (falls nicht das Standard-Skalarprodukt verwendet wird)sichergestellt werden kann. Im Vergleich zu (4.28) enthält die Projektion die Skalierungsin-formation Σ. Die Transformationsmatrix T für ΨP ergibt sich durch eine analoge Rechnungzu T = T T. Daraus folgt direkt, dass wegen ‖T ‖ = ‖T T‖ die Interpolation über die Basendie Interpolation über ihre Projektion die gleichen Unterräume liefern, also dass

U ((1− τ)Φ + τΨ) = U((1− τ)ΦP + τΨP

)(4.31)

gilt. Anschaulich ist wegen ‖T ‖ = ‖T T‖ die Skalierungen beider Projektionen identisch.Diese Aussage gilt daher auch für alle Linearkombinationen von Φ und ΦP . Nun kann manrechnerisch nachweisen, dass die Gleichung

(1− τ)Φ + ΦP

2 + τΨ + ΨP

2 = 12(ΦP + τΦ⊥︸ ︷︷ ︸

Φ→Ψ

+ ΨP + (1− τ)Ψ⊥︸ ︷︷ ︸Ψ←Φ

) (4.32)

gilt. Aufgrund von (4.31) liefert die Interpolation in (4.32) dabei den gleichen Unterraum wiedie Standard-Interpolation unter Verwendung von Φ und Ψ. Das bedeutet, dass die Standard-Interpolation von Borggaard aus zwei Effekten zusammengesetzt ist:

Φ→ Ψ: Φ verändert sich zu Ψ ausgehend von ΦP entlang von Φ⊥.Ψ← Φ: Φ verändert sich zu Ψ entlang von Ψ⊥ hin zu ΨP .

Diese Aufteilung ist in 4.9 ebenfalls visualisiert. Mit dieser Erkenntnis wird nun das neueInterpolationsschema

12(ΦP + f(τ)Φ⊥ + ΨP + f(1− τ)Ψ⊥) (4.33)

69

Page 82: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

aufgestellt, wobei f(τ) : [0, 1]→ [0, 1] eine bijektive und strikt monoton wachsende Funktionist. Die Aufteilung mit f(τ) und f(1− τ) stellt dabei sicher, dass die Interpolation nicht vonder Richtung der Interpolation abhängig ist, das heißt: Eine Interpolation für einen Punktzwischen Φ und Ψ liefert dieselben Ergebnisse unabhängig davon, ob bei der Interpolationvon Φ oder Ψ gestartet wird.

Das vorgeschlagene Interpolationsschema in (4.33) hat den Vorteil, dass es eine Generalisie-rung der Standard-Interpolation von Borggaard darstellt. Für die Wahl von f(τ) = τ ergibtsich die genannte Standard-Interpolation aus [15] in Kombination mit der Kongruenztrans-formation aus [3]. Es sind aber auch andere Wahlen von f(τ) möglich, die für die gegebeneInterpolationsaufgabe möglicherweise besser geeignet sind. Im Vergleich zur Exponentialab-bildung der Graßmann-Mannigfaltigkeit bietet sich beispielsweise an, f(t) = sin(0, 5πt) unddementsprechend f(1− t) = cos(0, 5πt) zu wählen. Zusammengefasst besitzt die Interpola-tion über Ausrichten die folgende Struktur

(1) Berechnen der Singulärwertzerlegung T = ΦTΨ = U ΣV T.

(2) Ausrichten von Φ an Ψ durch die Kongruenztranformation Φ→ ΦU V T.

(3) Verwenden von (4.33) zur Interpolation.

(4) Orthogonalisieren des Ergebnisses.

Die Schritte (1) und (2) können dabei für alle auftretenden Kombinationen bereits offlinedurchgeführt und gespeichert werden.

4.3 Adaptive Modellreduktion

Die vorgestellten Verfahren der nichtlinearen Modellreduktion für nichtlinearen Strömungspro-zesse basieren auf dem Versuch einer besseren expliziten Darstellung der nichtlinearen Effekteüber die Ausnutzung von Informationen der Snapshot-Daten. Einen anderen Ansatz verfolgtdie Modellinterpolation, wo nicht die Snapshot-Daten direkt verwendet werden, sondern An-nahmen über die Struktur der reduzierten Modelle beziehungsweise ihrer Basisfunktionen indie Modellreduktion miteinfließen. Obowhl die Modellinterpolation online erfolgt, so werdendoch alle wesentlichen Berechnungen offline durchgeführt. Dies ermöglicht in diesem Falldie Echtzeitfähigkeit, da die wichtigen Berechnungen zu komplex für eine Durchführung zurLaufzeit sind. Bei den nichtlinearen Modellreduktionsverfahren werden ebenfalls alle Berech-nungen offline durchgeführt. Daher verwenden die bisherigen Ansätze – bis auf einen Wertfür den aktueller Arbeitspunkt für die Modellinterpolation – keine aktuellen Messergebnisse.Statt über die Modellinterpolation und die nichtlineare Modenbestimmung zu versuchen, dienichtlinearen Effekte besser aus den vorliegenden Snapshot-Daten zu extrahieren, stellt sichdie Frage, ob nicht auch aktuelle Messwerte des zu reduzierenden Systems hierzu genutztwerden können. Dabei ist es nicht realistisch anzunehmen, dass diese Messwerte analog zuden Snapshot-Daten eine detaillierte Auflösung des Systems im Zustandsraum bieten, weshalb

70

Page 83: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.3 Adaptive Modellreduktion

die Ansätze in [92] und [91] für die hier verfolgten Zwecke nicht zielführend sind. Stattdessenmuss mit wenigen Informationen – wie beispielsweise nur einem (verrauschten) Messwert derRegelgröße – über einen geeigneten Mechanismus eine Veränderung des Modells online vor-genommen werden. Aufgrund dieser zur Laufzeit durchgeführten Anpassung des reduziertenModells wird dieser Ansatz im Folgenden mit dem Schlagwort der adaptiven Modellreduktionbezeichnet.

Analog zum Ansatz der Modellinterpolation müssen auch hier die beiden Optionen bedachtwerden, entweder die Modelle oder die Basisfunktionen anzupassen. Aufgrund der Zielset-zung, die Anpassung des Modells auf Basis von wenigen und möglicherweise nicht zuverlässi-gen (zum Beispiel verrauschten) Messwerten vorzunehmen, scheint es sehr gewagt, hierübereinen qualitativ verbessernden Rückschluss auf die Basisfunktionen vorzunehmen. Im Falle derModellinterpolation war eine Veränderung aufgrund des Arbeitspunktes möglich, da die Ba-sisfunktionen über ihre Repräsentation als Punkte auf Kurven auf Mannigfaltigkeiten wenigenParametern zugeordnet werden konnten. Es ist unklar, wie eine solche Zuordnung zwischenBasisfunktion und Messwert, die für eine Echtzeitadaption geeignet ist, aussehen soll. Hierkommt zusätzlich das Argument zum Tragen, dass bei einer Online-Adaption – im Gegensatzzu einer offline durchgeführten Berechnung – ein Regelkreis geschlossen wird, wodurch einefalsche oder unzuverlässige Adaption das Gesamtsystem destabiliseren kann. Daher solltenAdaptionsverfahren gewählt werden, deren destabiliserende Wirkung frühzeitig erkannt wer-den kann, um diese gegebenenfalls abzuschalten. Es ist auch hier nicht klar, wie dieser Effektbei einer Veränderung der Basisfunktionen, deren Einfluss auf die Stabilität sich erst nach dernachfolgenden Galerkin-Projektion quantifizieren lassen wird, frühzeitig beobachtet werdenkann. Deshalb scheint es hier angebrachter, eine Anpassung der Modelle vorzunehmen, sofernsich für diese eine eingängige Zuordnung von den Messwerten zu wenigen Modellparameternfinden lässt.

Eine solche Zuordnung zu wenigen Parametern ist für die Modelle über die im Stand derTechnik 1.2 vorgestellten Closure Models möglich. Diese werden für Strömungsprozesse dazugenutzt, den dynamischen und statischen Einfluss der vernachlässigten Basisfunktionen aufdie verbliebenen Basisfunktionen dadurch anzunähern, dass fiktive Viskositäten in Entspre-chung zu einem subskaligen Turbulenzmodell dem reduzierten Modell hinzugefügt werden.Die Closure Models dienen dabei primär der Stabilisierung der reduzierten Modelle. Ein wei-terer Vorteil ist, dass die zusätzliche Viskositäten eine zugängige physikalische Interpretationzulassen und sich daher als intuitive Parameter zur Anpassung des Modells ergeben. Währendbis 2017 die zu wählenden fiktiven Viskositäten in den Closure Models stets offline berechnetwurden, ist mit den Arbeiten von Benosman [14] hier auch der Sprung zu einer online durch-geführten Identifikation vollzogen worden. Die von Benosman verwendete Methodik basiertdabei auf Lernen, das modellfrei auf Basis des Extremum Seeking durchgeführt wird. Dabeiist die Struktur der fiktiven Viskositäten vergleichsweise fest und die Anpassung des Modellsist ein separater Mechanismus ohne direkte Einbindung in einen Regler. Der Beitrag diesesAbschnittes, dessen grundlegende Veröffentlichung nahezu zeitgleich mit [14] erschien, istes daher, einerseits den Weg der online Identifikation der fiktiven Viskositäten nochmals zubewerben und andererseits eine mit dem Regler verwobene Modelladaption vorzustellen, die

71

Page 84: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

allgemeinere Strukturen als die von Benosman zulässt.

4.3.1 Closure Models

Gegeben sei als Beispiel nochmals die Burgersgleichung (2.9) mit

∂v(t,x)∂t

= −v(t,x)∂v(t,x)∂x

+ µ∂2v(t,x)∂x2 .

Die Viskosität der Burgersgleichung ist µ. Die Closure Models verwenden im reduziertenModell eine angepasste Viskosität

µROM = µ+ µe(t,x), (4.34)

wobei µe mit dem aus dem Englischen inspirierten Index e für ’eddy viscosity’ die zusätzlichefiktive Viskosität ist. Die Ortsabhängigkeit der fiktive Viskosität µe führt dabei zu einemvon Basisfunktion zu Basisfunktion variierenden Einfluss von µe . Das kann am Beispiel derBurgersgleichung leicht eingesehen werden. Der Diffusionsterm µ∂

2v(t,x)∂x2 wird im reduzierten

Modell für aj (vergleiche (3.12)) zu

〈µROM∂2ϕ

∂x2 ,ϕj(x)〉L2 = µ〈∂2ϕ

∂x2 ,ϕj(x)〉L2 + 〈µe∂2ϕ

∂x2 ,ϕj(x)〉L2. (4.35)

Also ist der Einfluss des ortsabhängigen µe über das L2-Skalarprodukt an die Basisfunktionϕj und an die zweiten Ableitungen aller Basisfunktionen gekoppelt. Diese Eigenschaft wirdim Regelfall durch die Schreibweise

(µ+ µe(j))︸ ︷︷ ︸µROM

·〈∂2ϕ

∂x2 ,ϕj(x)〉L2 (4.36)

verdeutlicht, wo die fiktive Viskosität als vom Index der Basisfunktion abhängige Funktionverstanden wird. Im einfachsten Fall ist die fiktive Viskosität konstant über dem Ort. Diesresultiert in µe(j) = µe, da die fiktive Viskosität aus dem Skalarprodukt herausgezogen werdenkann. Dieses oft verwendete Modell für die fiktive Viskosität wird als Heisenberg-Modellbezeichnet [79]. Kompliziertere Ansätze adressieren die Ortsabhängigkeit meist direkt überdie index-basierte Schreibweise statt über ein explizites Ausformulieren der Ortsfunktionen.Hier sind besonders die Rempfer-Modelle [93]

µae(j) = µej

N, µbe(j) = µe

(j

N

)2, µce(j) = µe

√j

N, (4.37)

72

Page 85: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.3 Adaptive Modellreduktion

in Verwendung, bei denen der Index der Basisfunktion in Relation zur Gesamtzahl der Ba-sisfunktionen gesetzt wird und für diesen relativen Index lineare, quadratische oder Wur-zelfunktionen verwendet werden. Die Entscheidung für ein einzelnes und gegen die anderenRempfer-Modelle erfolgt heuristisch oder durch Abgleich der Resultate der verschiedenen Mo-delle.

4.3.2 Modelladaption durch Kalmanfilter

Wie bereits erläutert wird die fiktive Viskosität in der Regel offline identifziert. Hierzu wird einAbgleich der vom reduzierten Modell vorhergesagten Verläufe der zeitabhängigen Koeffizien-ten mit denen, welche sich aus den Snapshot-Daten ergeben, vorgenommen und die Viskositätüber eine Optimierung an die Daten angepasst. Dieses Vorgehen stellt eine Optimierung derViskosität im Bezug auf die Snapshot-Daten dar und ermöglicht daher keine Adaption desreduzierten Modells an die aktuell vorliegenden Strömungsbedingungen. Dies gilt sowohl fürdie fiktive Viskosität als auch für das Rempfer-Modell das ebenfalls starr festgelegt ist. Einewiederholte Bestimmung des Rempfer-Modells und der fiktiven Viskosität kann hier als onlineAdaption des reduzierten Modells fungieren und die Werte für das Viskositätsmodell nach-führen.

Aus der Welt der adaptiven Verfahren sind viele Methoden bekannt, die eine wiederholte Pa-rameteridentifikation oder Parameterschätzung zur Laufzeit erlauben. Hier bietet es sich ausSicht des Autors an, insbesondere solche Ansätze zur verfolgen, die auf der Schätzung derParameter in einem Beobachter wie einem Kalmanfilter fußen. Dies liegt vor allem daran, dassdiese Form der Adaption keinen zusätzlichen strukturelle Aufwand impliziert: Da die reduzier-ten Modelle dazu verwendet werden sollen, einen modellbasierten Regler zu entwerfen, nutztdieser Regler das nichtlineare Modell. Der Reglerentwurf wird daher mit hoher Wahrscheinlich-keit im Zustandsraum, in welchem das Galerkin-Modell vorliegt und der das adäquate Mittelzur Abbildung der Nichtlinearitäten darstellt, erfolgen. Bei Reglerentwürfen im Zustandsraumwird normalerweise nicht nur die aktuelle Regelabweichung dem Regler zugeführt, sondernebenso eine Information über den aktuellen Zustand der Regelstrecke – im vorliegenden Fallist dies der um die homogenisierenden Moden erweiterte Vektor der zeitlichen Koeffizientenae(t0) des reduzierten Modells. Dieser Vektor kann durch die Projektion der Basisfunktionenauf die aktuelle PDE-Lösung bestimmt werden. Die PDE-Lösung liegt bei realen Anwendun-gen jedoch nicht gemessen vor, sondern nur einzelne Messwerte, die es nicht erlauben, diezeitlichen Koeffizienten durch Projektion zu bestimmen. Daher wird ein Beobachter benötigt,der die Aufgabe erfüllt, den aktuellen Zustand der Regelstrecke, wie er im reduzierten Modelldargestellt würde, zu ermitteln. Somit ist ein Beobachter in der Struktur der Regelung bereitsvonnöten. Daher bedeutet das Verwenden des Beobachters zum gleichzeitigen Schätzen desZustandes und der Adaptionsparameter des Rempfer-Modells keinen zusätzliche strukturellenAufwand. Des Weiteren ist bereits seit den 60er Jahren [34] bekannt, dass im linearen Fallsogenannten joint Kalmanfilter gut dazu geeignet sind, gleichzeitig (wenige) unbekannte Sy-stemparameter und die Zustände des Systems zu schätzen. Für den Fall nichtlinearer Systeme

73

Page 86: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

kann eine ähnliche effektive Funktionalität den erweiterten joint Kalmanfiltern zugesprochenwerden, sofern die Annahme bezüglich der Modellstruktur und dem Einfluss der zu identifizie-renden Parameter hinreichend genau bekannt ist [48]. Daher wird im Folgenden eine adaptiveModellreduktion auf Basis der erweiterten joint Kalmanfilter vorgestellt.

Ein (zeitdiskretes) Kalmanfilter (wie beispielsweise in [109] nachzulesen) nimmt die Schät-zung des Systemzustandes in zwei Schritten vor, wobei im ersten Schritt eine Prädiktion desVerlaufes der Zustände und der Messgröße anhand des Modells und des aktuell geschätz-ten Zustandes vorgenommen wird, während im zweiten Schritt diese Prädiktion unter Ver-wendung von Fehlerkovarianzen korrigiert wird. Ein hybrides Kalmanfilter verwendet dabei –trotz des zeitdiskret erfolgenden Korrekturschritts – zur Prädiktion ein kontinuierliches Mo-dell. Bei einer Anwendung des Kalmanfilters auf ein lineares Prozessmodell können die für dieKorrektur notwendigen Kovarianzen in einer linearen Riccati-Differential- oder Differenzen-gleichungen parallel zum Prädiktionsschritt mit prädiziert werden. Im Falle eines nichtlinea-ren Prozessmodells kann die Prädiktion der Zustände und der Messgröße ebenfalls mit demnichtlinearen Modell erfolgen. Allerdings existiert für nichtlineare Systeme keine nichtlineareRiccati-Gleichung als Entsprechung der Prädiktion der Kovarianzen im Nichtlinearen. Daherverwendet ein erweitertes Kalmanfilter, dass eine einfache Übertragung des Kalmanfilter aufnichtlineare Systeme ist, das nichtlineare Modell zur Prädiktion der Zustände und das um dengeschätzten Zustand linearisierte zur Prädiktion der Kovarianzen. In einem joint Kalmanfilter[48] werden unbekannte Parameter dadurch geschätzt, indem diese Parameter dem Prozess-modell als zusätzliche Zustände hinzugefügt werden. Die Aufgabe des Anwenders bestehtdarin, ein geeignetes Modell zu formulieren, welches abbildet, wie sich die zu schätzendenParameter dynamisch auf die Zustände auswirken und wie sich die Parameter über der Zeitverhalten.

Um für die Rempfer-Modelle die unbekannten Parameter adäquat in das reduzierte Modelleinbetten zu können, müssen die Rempfer-Modelle zunächst selber parametriert werden. Be-trachtet man das Heisenberg-Modell als Funktion mit dem Exponenten

(jN

)0, so sind alle

Modelle in (4.37) Funktionen der Form

µe(j) = µe

(j

N

)pmit p ∈ R. (4.38)

Damit kann der Typ der Rempfer-Modelle über den Parameter p und die fiktive Viskositätüber den Parameter µe wiedergegeben werden. Dabei stellt wegen p ∈ R diese Form eineGeneralisierung der Rempfer-Modelle dar. Da für die konkrete Wahl von p nur heuristischeAnsätze existieren, wird p zusammen mit µe als unbekannter und von joint Kalmanfilter zuschätzender Zustand in das erweiterte Modell aufgenommen. Für den Fall der Burgersglei-chung ergibt sich somit der erweiterte Zustand α =

[ae µe p

]Tfür den Beobachter.

Für die unbekannten Parameter ist es üblich, diese als konstant anzunehmen, sofern keinegenaueren dynamischen Informationen für diese vorliegen. Da dies für µe und p nicht gegeben

74

Page 87: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4.3 Adaptive Modellreduktion

ist, werden sie als konstant modelliert. Damit ergibt sich die Prädiktion αpred des erweitertenjoint Kalmanfilter für die Burgersgleichung über die Differentialgleichung

apredk = aeqkae +

(µ+ µe

(k

N

)p)Lkae + gku

aN+1 = 0aN+2 = u (4.39)µprede = 0ppred = 0,

was der Notation des Galerkin-Modells in (3.11) – erweitert um die konstant modelliertenParameter und den das Rempfer-Modell – entspricht. Zur Prädiktion der Kovarianzen wird dieDifferentialgleichung entlang der prädizierten Trajektorie linearisiert und die Linearisierung indie Riccati-Gleichung eingesetzt. Notiert man Gleichung (4.39) als αpred = f

(αpred

)Damit

ergibt sich für die Kovarianzmatrix P ∈ R(N+4)×(N+4) über die Differentialgleichung

P = Df∣∣∣αpred

P + P Df∣∣∣αpred

+QKF

, (4.40)

wobei sich die Ableitung nach den unbekannten Parametern für j ≤ N zu

∂fj∂µe

∣∣∣∣∣α

=(j

N

)pLae, (4.41)

∂fj∂p

∣∣∣∣∣α

= µe

(j

N

)p· log

(j

N

)Lae, (4.42)

ergibt. Als Anfangswert für die Kovarianzmatrix P sollte eine positiv definite Matrix gewähltwerden, wobei standardmäßig die Einheitsmatrix Verwendung findet. Die Matrix Q

KFist

ein Einstellparameter des Kalmanfilters und stellt idealerweise die Kovarianz des Modellrau-schens dar. Der dem Prädiktionsschritt nachfolgende Korrekturschritt wird auf zeitdiskreterBasis vorgenommen. Dazu wird die kontinuierliche Berechnung der Differentialgleichungenbei Eingang eines neuen Messwertes gestoppt. Bildet dazu C über Cα = y auf Mess- undRegelgrößen y ab, dann gilt für den Korrekturschritt

K = PCT(CPCT +RKF

)−1

αkor = αpred +K(y −Cαpred

)(4.43)

P = (I −KC)P (I −KC)T +KRKT.

75

Page 88: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

4 Angepasste Methoden der Modellreduktion

Hierbei ist RKF das Analogon zu QKF

, wobei dieser Einstellparameter die Kovarianz desMessrauschens beinhaltet. Die MatrixK ist die Korrekturmatrix des Kalmanfilters. Die letzteZeile führt eine Korrektur der Kovarianzmatrix P auf Basis der eingegangenen Messung vor,während die vorletzte den prädizierten Zustand zu αkor korrigiert. Als Startwerte für µe undp bieten sich µe = 0 und p = 1 an.

Das präsentierte Filter ermöglicht eine gleichzeitige Schätzung des Zustandes des reduziertenModells gemeinsam mit den beiden unbekannten Parametern des verallgemeinerten Rempfer-Modells (4.38). Durch die gleichzeitig mit der Zustandsschätzung durchgeführte Schätzungder fiktiven Viskositäten passt sich das reduzierte Modell in jedem Zeitschritt an das Strö-mungsfeld und die von diesem erhaltenen Messwerte an. In der praktischen Anwendung sindhier noch zwei Punkte von besonderer Wichtigkeit. Erstens ist die Wahl von Q

KFund RKF

entscheidend für die Performanz des Kalmanfilters. Das gilt insbesondere bei der Verwendungvon joint Kalmanfilter, da die Wahl der Einträge in Q

KFund RKF festlegt, ob das Filter

Abweichungen zwischen gemessenen und prädizierten Wert entweder einem Modellfehler odereinem Messfehler zuordnet und weiterhin, ob die Korrektur des Zustandes sich in den zeitli-chen Koeffizienten a oder den zu schätzenden Parametern p und µe niederschlägt. Hier istein behutsames Optimieren der Parameter auf Basis von Simulationen notwendig, wofür imAnwendungsabschnitt 7 Beispiele gegeben werden. Zweitens kann durch das Hinzufügen meh-reren konstanter Zustände – das Modell in (4.39) beinhaltet derer drei – die Beobachtbarkeitdes Systems verloren gehen. Beobachtbarkeit ist jedoch eine wichtige Voraussetzung für densinnvollen Einsatz von Beobachtern, da ansonsten der Beobachterfehler nicht schnell genugoder sogar gar nicht konvergiert. Daher muss vor Verwendung der adaptiven Modellreduk-tion – beispielsweise durch das simulative Überprüfen der Beobachtbarkeit des linearisiertenSystems – überprüft werden, ob das System üblicherweise beobachtbar ist und ein Verlust anBeobachtbarkeit nur in einzelnen Zeitschritten erwartet werden muss.

76

Page 89: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

5 Grundlagen der optimalen Regelung

Nach der Darstellung diverser Verbesserungen für reduzierte Modelle, die von Strömungspro-zessen abgeleitet werden, wendet sich diese Arbeit der Verwendung dieser Modelle im Rahmeneines Reglerentwurfs zu. Im Abschnitt 2.1 wurde durch die physikalische Modellierung vonStrömungen gezeigt, dass deren wesentliche Dynamik nur durch nichtlineare partielle Dif-ferentialgleichungen erfasst werden kann. In der Darstellung des Stands der Technik in 1.2wurde ausgeführt, dass sich der Reglerentwurf für partielle Differentialgleichungen in die Ka-tegorien des late lumping und des early lumping unterteilen lässt. Der für das Verständnis desearly lumping wichtige Baustein der Modellreduktion wurde in 3.1 und 3.2 dargestellt. Fürdie Grundlagen des late lumping ist es zunächst essentiell zu rekapitulieren, dass die meistenReglerentwurfsverfahren, die auf partiellen Differentialgleichungen basieren, nicht für nichtli-neare partielle Differentialgleichungen geeignet sind. Eine Ausnahme stellt hier die optimaleSteuerung partieller Differentialgleichungen dar, für die eine umfangreiche mathematischeTheorie auch für den nichtlinearen Fall existiert. Die optimale Steuerung partieller Differen-tialgleichungen kann dabei auch als Optimierung unter PDE-Nebenbedingungen verstandenwerden [52]. Daher soll in diesem Abschnitt ausgehend von der Optimierung im Rn überden klassischen optimalen Regler der Systemtheorie der Weg zur Optimalsteuerung mit PDE-Nebenbedingungen gegangen werden. Im Gegensatz zu den Methoden der Modellreduktion,die im Rahmen dieser Arbeit ergänzt werden, sollen die Verfahren der Optimalsteuerung fürPDEs im Wesentlichen nur angewandt werden. Deshalb wird anders als bei der Darstellungder Modellreduktion auf eine detaillierte Darstellung verzichtet. Für die Beweise oder dierigorosen mathematischen Formalismen, wie Existenz und Eindeutigkeit der Lösungen derOptimierungsprobleme, sei dabei auf [52] und auf [116] verwiesen. Die Grundlagen der klas-sischen Optimierung können unter anderem in [77] oder [97] nachgelesen werden.

5.1 Klassische Optimierungsprobleme

Zur Erläuterung der Optimalsteuerung für PDEs sollen die klassischen Optimierungsproblemeals Ausgangspunkt dienen. Gegeben sei eine reellwertige Funktion f : Rn → R. Aus derklassischen Analysis ist bekannt, dass die Funktion f auf einer kompakten Menge Ω einMaximum beziehungsweise Minimum annimmt, sofern f stetig ist. Ist f zusätzlich stetigdifferenzierbar, liegt das Minimum entweder am Rand von Ω, oder es gilt am Punkt desMinimums im Inneren von Ω für die Ableitung von f : ∇f = 0. Die Unterscheidung zwischendem Rand und dem Inneren von Ω ist notwendig, da am Rand die Ableitung von f nichtgebildet werden kann. Ist f eine konvexe Funktion und Ω eine konvexe Menge, so wird das

77

Page 90: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

5 Grundlagen der optimalen Regelung

Minimum im Inneren von Ω angenommen und die Forderung ∇f = 0 ist eine notwendigeBedingung für das Minimum. Weiß man über f sogar, dass f strikt konvex ist, so ist dieseForderung sowohl notwendig als auch hinreichend und das Minimum ist eindeutig. Dabei heißteine Menge Ω konvex, wenn sie alle möglichen Verbindungslinien von zwei Punkten aus Ωvollständig enthält, und eine Funktion (strikt) konvex, wenn sich die Verbindungslinie zweierPunkte stets (strikt) oberhalb der Funktion selber befindet. Ist f zweimal stetig differenzierbar,so ist die Forderung nach Konvexität von f gleichbedeutend mit der Forderung der positiven(Semi-)Definitheit des Hessematrix von f . Daher nennt man das Optimierungsproblem

minx∈Ω

f(x) Ω ⊂ Rn (5.1)

ein konvexes Optimierungsproblem, wenn Ω und f konvex sind. Diese Optimierungsproble-me können genau dadurch gelöst werden, indem ∇f = 0 bestimmt wird. Dabei wiederumhandelt es sich um eine klassische Nullstellensuche, für die zur numerischen Lösung gerneNewton-Methoden verwendet werden.

Erweitert man das vorgestellte Optimierungsproblem (5.1) um Nebenbedingungen, so lässtsich das Optimierungsproblem mit Nebenbedingungen durch die Verwendung von Lagrange-Multiplikatoren auf Optimierungsprobleme ohne Nebenbedingungen der Form (5.1) zurück-führen. Dazu werden die (möglicherweise auch nichtlinearen) Nebenbedingungen mithilfe derFunktion c : Rn → Rm als c(x) = 0 geschrieben. Ist die Funktion c so aufgestellt, dass mvoneinander unabhängige Gleichungen entstehen, so muss für ein sinnvolles Optimierungspro-blem m < n gelten. Im zweiten Schritt wird die Funktion f zu

L(x,λ) = f + λT ·c (5.2)

erweitert. Hier bezeichnet L die sogenannte Lagrangefunktion und λ : Rn → Rm dieLagrange-Multiplikatoren. Fasst man λ als vektorwertige Zusammenstellung von m einzelnenLagrange-Multiplikatoren auf, so sieht man, dass die Lagrange-Multiplikatoren aus demselbenRaum, aus dem auch f stammt, gewählt werden. Die Anzahl der zu verwendenden Lagrange-Multiplikatoren entspricht der Anzahl an auftretenden Nebenbedingungen. Der Vorteil an derNutzung der Lagrangefunktion ist es nun, dass das Optimierungsproblem mit Nebenbedin-gungen

minx∈Ω

f(x) mit c(x) = 0 Ω ⊂ Rn (5.3)

genau dann gelöst wird, wenn das Optimierungsproblem ohne Nebenbedingungen (5.1) mitL anstelle von f und

[x λ

]Tanstelle von x gelöst wird. Das heißt, dass nun die Gleichun-

gen ∇xL = 0 und ∇λL = c = 0 gelöst werden müssen. Diese Gleichungen werden auchals die KKT-Bedingungen – benannt nach den Wissenschaftlern Karush, Kuhn und Tucker –bezeichnet. Damit ist die Lösung von Optimierungsproblemen mit Gleichungsnebenbedingun-gen auf die Lösung von Optimierungsprobleme ohne Nebenbedingungen zurückgeführt. Ein

78

Page 91: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

5.2 Optimale Steuerung und Regelung

ähnliches Vorgehen lässt sich auch für Ungleichheitnebenbedingungen durchführen, die aberfür diese Arbeit nicht benötigt werden. Wichtig ist noch anzumerken, dass die Konvexität desOptimierungsproblems mit Nebenbedingungen nur dann erhalten bleibt, wenn die Nebenbe-dingungen c bestimmte Voraussetzungen erfüllen. Diese sind beispielsweise erfüllt, wenn dieNebenbedingungen linear sind. Ansonsten geht die Eindeutigkeit der Lösung verloren. Nichts-destoweniger bleibt auch im Falle nichtlinearer Nebenbedingungen die notwendige Forderungnach ∇xL = 0 erhalten.

5.2 Optimale Steuerung und Regelung

Das grundlegende Prinzip der Optimierung lässt sich von der Minimierung von Funktionenauch auf die Minimierung von Funktionalen übertragen. Funktionale bilden Funktionen ausbestimmten Funktionenräumen auf reelle Zahlen ab. Damit ist eine Distribution ein Funktio-nal; nicht jedes Funktional ist hingegen eine Distribution, da diese zusätzlich stetig und linearsein müssen und auf dem C∞0 operieren. Bezeichnet J(x(t)) das entsprechende Funktionalmit der Funktion x(t) ∈ X als Argument, dann lautet das Optimierungsproblem

minx∈X

J(x(t)). (5.4)

Hierbei ist X ein normierter Funktionenraum. Die Übertragung des Resultates ∇f = 0aus der klassischen Optimierung ist allerdings nicht direkt möglich, da in Funktionenräu-men partielle und totale Differenzierbarkeit nicht zusammenfallen. Der Gradient ∇ fasst imendlichdimensionalen Fall die einzelnen partiellen Ableitungen zusammen und enthält im Fal-le der Stetigkeit der partiellen Ableitungen sämtliche Ableitungsinformationen. Im Falle derAbleitung von Funktionen scheitert dieses Vorgehen, da es unendlich viele Richtungen gibt,in welche partiell abgeleitet werden könnte. Zur Lösung des Problems gibt es das Konzeptder Fréchet-Differenzierbarkeit, welches die Verallgemeinerung der (totalen) Differenzierbar-keit für normierte Räume darstellt. Im Folgenden wird die (eingeschränkte) Definition fürFunktionale gegeben.

Definition 10 Sei X ein normierter (Funktionen)-Raum. Eine Abbildung f : X → R heißtFréchet-differenzierbar, wenn eine stetige, lineare Abbildung df : X → R existiert, für dief(x+h)−f(x)−df(x)·h = o(‖h‖) für h→ 0 gilt. In diesem Fall heißt df Fréchet-Ableitungvon f .

Hier bezeichnet o(‖h‖) das Landau-Symbol. Die Fréchet-Differenzierbarkeit entspricht in end-licher Dimension der totalen Differenzierbarkeit. Statt die Ableitung eines Funktionals überdie Zusammenfassung der einzelnen partiellen Ableitungen zu definieren, wird sie als genauder lineare Operator definiert, der den Fehler bei der Approximation des Funktionals stärkerals linear verschwinden lässt. Für die Fréchet-Differenzierbarkeit gelten die üblichen Rechen-regeln für Ableitung im Rn. Deswegen ergibt sich die Lösung des Optimierungsproblems (5.4)

79

Page 92: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

5 Grundlagen der optimalen Regelung

zu df = 0 im Sinne der Fréchet-Differenzierbarkeit. Besitzt das Funktional mehrere Funk-tionen als Eingang – also f : X × Y → R – so kann über die Fréchet-Ableitung nach deneinzelnen Funktionsargumenten ein partielle Ableitung ∂f

∂xim Fréchet-Sinne definiert werden.

Damit überträgt sich die Lösung des Optimierungsproblems auch auf den Fall von Nebenbe-dingungen, wo analog zu (7.37) Lagrangefunktionen zum Einsatz kommen können. Es mussdann von der Lagrangefunktion L(x,λ) die Fréchet-Ableitung dL auf X ×Λ oder die beidenpartiellen Ableitungen ∂L

∂xund ∂L

∂λzu Null gesetzt werden.

In der Regelungstechnik findet die Methode der Optimierung von Funktionalen unter Aus-nutzung der Fréchet-Ableitung prominent bei der optimalen Regelung Verwendung. Der LQR(Linear quadratischer Regler) ist hier das vermutlich bekannteste Beispiel der klassischenSystemtheorie. Hier wird das Gütefunktional

J(ξ(t),u(t)) =∞∫0

12ξ

TQξ + 12u

TRu dt mit ξ = Aξ +Bu , ξ(0) = ξ0 (5.5)

mit der Zustandsgröße ξ(t) und der Stellgröße u(t) betrachtet. Die Matrizen Q und R sindpositive definite Wichtungsmatrizen für die Zustands- beziehungsweise Stellgrößen, währendA und B die System- und Eingangsmatrix der klassischen Zustandsraumdarstellung sind.Beide zeitabhängigen Funktionen kommen aus passenden Funktionenräumen, die mit einerNorm versehen sind. Durch die Tatsache, dass die Wichtungsmatrizen positiv definit sind,ist das Funktional konvex. Da zusätzlich die Gleichungsnebenbedingungen linear sind, ist eineindeutige Lösung des Optimierungsproblem minu J(x,u) zu erwarten. Ein formaler Beweishierfür findet sich beispielsweise in [57]. Geht man – ohne die Frage nach Existenz oderEindeutigkeit zu stellen – an die Sache heran und versucht das Problem mit der Methode derLagrangefunktion zu lösen, so stellt man zunächst die Lagrangefunktion mit dem Lagrange-Multiplikator λ(t) als

L(ξ,u,λ) =∞∫0

12ξ

TQξ + 12u

TRu− λT(ξ −Aξ +Bu

)dt (5.6)

auf. Anfangsbedingungen für λ werden zunächst ausgeklammert. Die Berechnung der parti-ellen Fréchet-Ableitungen ergibt dann

∂L∂λ

=∞∫0

ξ −Aξ +Bu dt!= 0 , ∂L

∂u=∞∫0

uTR− λTB dt!= 0 (5.7)

für λ und u. Da die Gleichungen unabhängig vom betrachteten Anfangszeitpunkt sind, müssendie Integranden verschwinden und es ergibt sich die bereits bekannten Gleichungsnebenbe-dingung für ξ

ξ = Aξ +Bu (5.8)

80

Page 93: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

5.2 Optimale Steuerung und Regelung

und das optimale Stellgesetz für u in Abhängigkeit von λ

u = R−1BTλ. (5.9)

Die Inverse der Matrix R existiert dabei, da R positiv definit ist. Für die Applizierung dieseroptimalen Stellgröße wird λ benötigt. Dieses lässt sich aus der partiellen Ableitung der La-grangefunktion nach ξ bestimmen. Da allerdings unklar ist, wie ξ nach ξ abgeleitet werdenkann, muss zunächst die Umformung

L =∞∫0

12ξ

TQξ + 12u

TRu− λT (−Aξ +Bu) dt+∞∫0

λTξ dt

=∞∫0

12ξ

TQξ + 12u

TRu− λT (−Aξ +Bu) dt−∞∫0

λTξ dt+

[λTξ

]∞0

(5.10)

durchgeführt werden, wobei die partielle Integration verwendet wurde. Damit ergibt sich ausder Forderung ∂L

∂ξ

!= 0 die Gleichung

λ = Qξ −ATλ. (5.11)

Hier sind zwei wichtige Punkte anzumerken: Die gewöhnliche Differentialgleichung für λ hatzum einen das umgekehrte Vorzeichen der Differentialgleichung für ξ und zum anderen wirdstatt der Systemmatrix A deren adjungierter Operator AT verwendet. Das liegt daran, dasszum Berechnen der Ableitung durch das Verwenden der partiellen Integration die Rechenregelnder distributionellen Ableitung gemäß Satz 1 verwendet wurde. Die Lösung von Optimalsteue-rungsproblemen ist also eng mit den Distributionen und im Falle der PDEs mit dem schwachenLösungsbegriff verbunden. Die Formel (5.11) wird auch als adjungierte Gleichung bezeichnet.

Die optimale Stellgröße u(t), welche die optimale Regelung gemäß des Gütefunktionals (5.5)darstellt, lässt sich dadurch ermitteln, dass die Gleichungen (5.8) und (5.11) gelöst unddas resultierende λ in (5.9) eingesetzt wird. Nimmt man hier an, dass sich der optimaleRegler gemäß (5.9) als Stellgesetz ergibt, dass linear im Systemzustand ξ ist, so muss λ =−P (t)ξ gelten. Setzt man diesen Zusammenhang in die Gleichungen ein, so ergibt sich unterVerwendung der Produktregel die wohlbekannte Riccati-Differentialgleichung

− P = P A+ATP +Q− P BR−1BTP . (5.12)

Es bleibt festzuhalten, dass sich das bekannte Stellgesetz des LQR aus der Lösung des Opti-malsteuerungsproblems mithilfe von Lagrange-Multiplikatoren ergibt. Dabei vereinfachen sichdie Berechnungsformeln zur Riccati-Gleichung in (5.12), da für lineare Differentialgleichun-gen als Nebenbedingung auch ein linearer Zusammenhang zwischen λ und ξ angenommen

81

Page 94: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

5 Grundlagen der optimalen Regelung

werden kann. Bei der Übertragung dieses Konzeptes auf PDEs werden einige der hier beobach-teten Phänomen wieder auftauchen. Dies gilt insbesondere für die Struktur der adjunigertenGleichung (5.11), die mit dem adjungierte (d.h. transponierten) Operator und umgedrehtenVorzeichen gelöst werden.

5.3 Optimalsteuerungsprobleme für PDEs

Die mathematische Vorgehensweise, die zur Herleitung der Lösung für das Optimalsteue-rungsproblem mit linearen gewöhnlichen Differentialgleichungen verwendet wurde, lässt sichmit geringen technischen Modifikationen auch auf nichtlineare partielle Differentialgleichun-gen übertragen. Diese Anpassungen betreffen zum einen Forderungen nach Regularität undder Struktur von den verwendeten Funktionenräume und zum anderen an die Struktur derNichlinearität, die notwendig sind, um die Existenz und Eindeutigkeit der Lösung sicherzustel-len. Da hierauf nicht der Fokus dieser Arbeit liegt, sei in diesem Zusammenhang nochmals auf[52] verwiesen. Beispielsweise erfüllen die zweidimensionalen inkompressiblen Navier-Stokes-Gleichungen die Bedingungen zur Lösung des Optimalsteuerungsproblems.

Betrachtet wird nun ein Gütefunktional der Form

J(v(t,x),u(t)) =∞∫0

12〈v,Qv〉L2 + 1

2uTRu dt (5.13)

mit den Nebenbedingungen v = F(v, ∂v, . . . , ∂αv) auf Ω und g(v, ∂v,u) = 0 auf ∂Ω.

Hierbei ist die Ortsableitung ∂v im Sinne der distributionellen schwachen Lösung in Definition4 notiert und zu verstehen. Im Vergleich zu Formulierung für gewöhnliche Differentialgleichun-gen liegt die Nebenbedingung nun als PDE vor. Die Eingangsgrößen u tauchen dabei in denRandbedingungen auf. An dieser Stelle sind auch andere, allgemeingültigere Formulierungenmöglich, die u in der PDE selbst statt nur in den Nebenbedingungen berücksichtigen. ImFalle der Navier-Stokes-Gleichungen könnte dies beispielsweise eine zusätzliche Kraft sein, dieinnerhalb des betrachteten Gebietes wirkt. Allgemein würden durch eine solche Formulierungsteuerbare Quellen oder Senken innerhalb des Gebietes eingebracht. Da bei technischen Sys-teme aber im Regelfall das System nur von außen über den Rand des Strömungsprozesses– beispielsweise durch Zu- oder Abflüsse über den Rand – beeinflusst werden kann, wird imFolgenden davon ausgegangen, dass die Eingangsgrößen nur die Randbedingungen der PDEbeeinflussen. Als weitere Änderung zu 5.5 wurde das Skalarprodukt 〈·, ·〉L2 eingefügt. Dies istnotwendig, da ansonsten u(t) und v(t,x) nicht geeignet miteinander ins Verhältnis gesetztwerden können, da v ortsabhängig ist, u jedoch nicht.

Analog zum Fall der gewöhnlichen Differentialgleichungen führt man nun eine Lagrangefunk-tion ein. Die Lagrange-Multiplikatoren sind als λ(t,x) ebenfalls ortsverteilt, da diese analogzu v gewählt werden müssen. Daher wählt man als Lagrangefunktion

82

Page 95: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

5.3 Optimalsteuerungsprobleme für PDEs

L(v,u,λ) =∞∫0

12〈v,Qv〉L2 + 1

2uTRu− 〈λ, v −F〉L2 dt. (5.14)

Bildet man nun die Ableitung nach λ so ergeben sich erneut die Nebenbedingungen in Ω.Um nach den Größen v und u abzuleiten, muss analog zum Falle der gewöhnlichen Diffe-rentialgleichung die partielle Integration verwendet werden, um den Ausdruck v aufzulösen.Dies entspricht der Berechnung des formal adjungierten Operators im Falle der distributio-nellen Ableitung mit der Abweichung, dass – da die Randbedingungen im Gegensatz zu denDistributionen nicht homogen sind – sich zusätzliche Terme für die Ausdrücke am Rand ∂Ωergeben, in welche dann u über die Randbedingungen eingeht.

Zur Veranschaulichung dieser Rechenschritte wird nun das Beispiel der Burgersgleichung

v = −v ∂v∂x

+ µ∂2v

∂x2 , y(t, 0) = u(t) , y(t, 1) = 0 (5.15)

bemüht. Dann ergibt sich aus der partiellen Integration des zusätzlichen Terms der Lagran-gefunktion

∞∫0

〈λ, v + v∂v

∂x− µ∂

2v

∂x2 〉L2 dt =1∫

0

∞∫0

λv dt dx+∞∫0

1∫0

λ

2∂(v2)∂x

dx dt−∞∫0

1∫0

µλ∂2v

∂x2 dx dt

︸ ︷︷ ︸F

=

−1∫

0

∞∫0

λv dt dx−∞∫0

1∫0

∂λ

∂x

v2

2 dx dt−∞∫0

1∫0

µ∂2λ

∂x2 v dx dt

︸ ︷︷ ︸G

+∞∫0

2v2]1

0+∞∫0

[µ∂λ

∂xv

]1

0=

(5.16)∞∫0

〈G(λ), v〉L2 − u2 λ(t, 0)2︸ ︷︷ ︸

=0

−uµ∂λ∂x

(t, 0) dt

Die Integrale konnten im ersten Umformungsschritt mithilfe des Satzes von Fubini vertauschtwerden, da im Falle einer erfolgreichen Steuerung alle Integrale endlich sind. Der Ausdruckmit u2 verschwindet, da λ homogenen Randbedingungen besitzt [116]. Für die Karush-Kuhn-Tucker-Bedingungen ergibt sich unter Verwendung der Tatsache, dass die Integranden ver-schwinden müssen, somit

83

Page 96: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

5 Grundlagen der optimalen Regelung

∂L∂λ⇒ v = −v ∂v

∂x+ µ

∂2v

∂x2

∂L∂u⇒ u = µ

R

∂λ

∂x(t, 0) (5.17)

∂L∂v⇒ λ = −∂λ

∂xv − µ∂

∂x2 +Qv

Für λ werden hier nicht die Anfangswerte, sondern die Endwerte vorgegeben. Daher muss dieentstehende PDE rückwärts in der Zeit gelöst werden [116]. Wie im Falle der gewöhnlichenDifferentialgleichungen hat sich das Vorzeichen der Ausgangs-PDE wie bei der distributionel-len Ableitung umgedreht. Da in der bisherigen Formulierung der Endwert bei t→∞ erreichtwird, muss für die numerische Lösung der adjungierten Gleichungen, die einen sinnvollenStartwert braucht, ein Gütefunktional verwendet werden, bei welchem sich die Integrationüber die Zeit nur über dem Intervall T = [0, tf ] mit der Endzeit tf durchgeführt wird. DerParameter tf gibt dabei an, welcher Zeitrahmen von der Steuerung berücksichtigt wird undist neben den Wichtungsmatrizen Q und R ein weiterer Einstellparameter.

Das Optimalsteuerungsproblem für PDEs lässt sich analog zu dem für gewöhnliche Differen-tialgleichungen lösen. Die drei partiellen Ableitungen nach λ, v und u liefern eine PDE für v,eine PDE für λ und ein Stellgesetz für u. Da die adjungierte PDE für λ rückwärts in der Zeitgelöst werden muss und die PDE für v nicht von λ abhängt, ist das Vorgehen, zunächst diePDE für v mit einem gewählten u vorwärts in der Zeit zu lösen. Die entstehende Lösung für vwird dann in der PDE für λ verwendet, um diese rückwärts in der Zeit zu lösen. Mit dem sichdaraus ergebenden λ lässt sich dann u berechnen. Da dieses u in der Regel nicht dem anfangsgewählten u zum Lösen von v entspricht, ist dies noch nicht die optimale Lösung. Stattdessenwurde ein Optimierungsschritt gemäß der Newton-Iteration durchgeführt, indem dem Gradi-enten der Lagrangefunktion gefolgt wurde [52]. Für die vollständige Berechnung der Lösungdes Optimalsteuerungsproblems muss daher dieser Schritt mit dem jeweils neuen u mehrfachwiederholt werden. Dies unterscheidet sich von der Berechnung des LQR weniger durch dieVerwendung von PDEs als durch die Nichtlinearität. Durch den nichtlinearen Charakter derBurgersgleichung führt der simple Ansatz des LQR, ein lineares Stellgesetz zu fordern, nichtzur optimalen Lösung des Steuerungsproblems. Insgesamt liegt jedoch mit dem vorgestelltenRechenschema und allgemeiner Lösungsansatz für die Bestimmung der optimalen Stellgrößefür nichtlineare partielle Differentialgleichungen vor.

84

Page 97: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

6 Angepasste Methoden der optimalenRegelung

Im vorangegangenen Abschnitt wurde die optimale Steuerung von partieller Differentialglei-chungen erläutert. Dieses Verfahren ist für die Regelung von Strömungsprozessen besondersdeshalb attraktiv, da es sich – im Gegensatz zu der überwiegenden Mehrheit der Reglerent-wurfsverfahen für PDEs – auch für nichtlineare Systeme anwenden lässt. Allerdings handeltes sich bei diesem Verfahren noch um eine Steuerung und keine Regelung. Der Beitrag diesesAbschnitt ist es, verweisend auf die Publikationen des Autors in [87] und [89], eine Methodezu entwickeln, die es möglich macht, in einer echtzeitfähigen Form den Übergang von deroptimalen Steuerung von PDEs hin zur Regelung zu vollziehen.

Ein klassisches und sehr bekanntes Verfahren, in welchem eine Steuerung zu Regelung er-weitert wird, ist die Modellprädiktive Regelung (MPR). Bei dieser wird zu jedem Zeitschritt,in welchem die zeitdiskret arbeitende MPR aufgerufen wird, das Optimalsteuerungsproblemerneut gelöst. Möchte man in einer analogen Weise den optimalen Steuerungsentwurf fürPDEs durch das wiederholte Lösen des Optimierungsproblems zu jedem Zeitschritt zu einerRegelung modifizieren, so ist dies nicht ohne weiteres möglich. Dies liegt vor allem an zweiPunkten: Zum einen müssen die KKT-Bedingungen in (5.17) iterativ gelöst werden, damitsich die optimale Stelltrajektorie ergibt, da die KKT-Bedingungen nur einen Schritt einerNewton-Iteration darstellen. Es ist unklar, wie viele Iterationen notwendig sind, damit dasVerfahren konvergiert. Daher kann durch die unklare Iterationsanzahl Echtzeitfähigkeit nurbedingt sichergestellt werden. Zum anderen benötigt selbst die Lösung einer einzigen Iteratio-nen durch das Lösen von (5.17) bei weitem zu viel Zeit, um auch nur annähernd in Echtzeitdurchgeführt werden zu können. Denn (5.17) beinhaltet das Lösen einer PDE vorwärts in derZeit und das anschließende Lösen einer PDE rückwärts in der Zeit. Da die Ergebnisse aufein-ander aufbauen, kann diese Berechnung nicht parallelisiert werden. Die Lösung der PDE istzudem über den gesamten Zeithorizont T = [0, tf ] durchzuführen, welcher von der Regelungmiteinbezogen wird. Da dieser Zeitrahmen nicht zu klein sein sollte, ist von der numerischenLösung der PDEs ein großer Zeitaufwand zu erwarten. Das Lösen der adjungierten PDE er-folgt auf demselben Rechengitter wie das Lösung der PDE der Regelstrecke, wodurch fürbeide PDEs ein vergleichbarer Zeitaufwand zu erwarten ist. Daher ist das Lösung auch nureiner einzigen Iteration zur Lösung des Optimierungsproblems in annehmbarer Zeit mehr alsillusorisch.

Die Idee des neuartigen Reglerentwurfsverfahrens dieser Arbeit ist es, die zwei genannten Pro-bleme wie folgt zu lösen: Das Lösen einer Iteration des Optimierungsproblems wird dadurch

85

Page 98: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

6 Angepasste Methoden der optimalen Regelung

ermöglicht, dass reduzierte Modelle anstelle der PDE der Regelstrecke und der adjungier-ten PDE eingesetzt werden. Damit reduziert sich die numerische Berechnung auf das Lösenvon zwei gewöhnlichen Differentialgleichungen. Das Problem der verschiedenen Iterationenwird dadurch umgegangen, dass – inspiriert vom für MPR angewandten Realtime IterationScheme [31] – nur eine Newton-Iteration durchgeführt wird. Von der so ermittelten optima-len Stellgrößentrajektorie wird der erste Wert an die Regelstrecke ausgegeben, während dieverbleibende Trajektorie um einen Zeitschritt verschoben als Startlösung des nächsten Zeit-schrittes Verwendung findet. Dadurch wird die benötigte Rechenzeit abschätzbar und massivreduziert, was zu einem echtzeitfähigen Regler führt. Dieser Regelentwurf kann als Versuchdes Zusammenführens der Vorteile des late und early lumpings gesehen werden. Durch dasVerwenden der auf PDE-Level bestimmten Optimalitätbedingungen beinhaltet der Regler-entwurf wesentliche Elemente des late lumpings. Im Rahmen der Zuordnung differentiate-the-discretize oder discretize-then-differentiate gehört der Regler zur ersten Kategorie, da dieFormulierung der KKT-Bedingungen vor dem Diskretisieren im Rahmen der Modellreduktionerfolgt. Dabei behandelt der Reglerentwurf, indem die Methoden der Modellreduktion, dieklassisch für die Regelstrecke verwendet werden, auf die Optimalitätsbedingungen angewandtwerden, die Schritte des Reglerentwurfs und der Modellreduktion als eine Einheit. Die Mo-dellreduktion wird nicht als vom Reglerentwurf entkoppelt betrachtet, sondern ist Teil desReglerentwurfprozesses.

6.1 Modellreduktion der optimalen Steuerung

Der Kernschritt zum beschriebenen Regler sind die reduzierten Modelle der KKT-Bedingungenin (5.17). Diese lassen sich über die Galerkin-Projektion analog zu den reduzierten Modelleder Regelstrecke ermitteln, was im Folgenden am Beispiel der Burgersgleichung exemplifiziertwird. Für die Burgersgleichung selber wurde bereits das reduzierte Modell in (3.11) als

a = aeqae + µLae + guaN+1 = 0aN+2 = u

mit den Basisfunktionen ϕ und dem Zustand ae hergeleitet. Verwendet man nun den Separati-onsansatz mit Basisfunktionen ψ(x) und den Koeffizienten b(t) für die Lagrange-Multiplikatoren,das heißt

λa(t,x) =∑i

bi(t)ψ(i)(x) = ψ(x)Tb(t), (6.1)

so führt das Rechenschema der Galerkin-Projektion auf die Gleichungen

b = aeqabb+ µLbb+QLaa (6.2)

86

Page 99: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

6.2 Bestrafen von Stellgrößenänderung und Regelfehler

für die adjungierte PDE mit den Matrizen

qabijk = −〈ϕ(i)(x) · ∂ψ(j)

∂x(x),ψ(k)(x)〉L2

Laik = 〈ϕ(i)(x),ψ(k)(x)〉L2 (6.3)

Lbik = −〈∂2ψ(i)

∂x2 (x),ψ(k)(x)〉L2.

Die Stellgröße ergibt sich dementsprechend zu

u = µ

R

(∂ψ(0)∂x

)T

b(t). (6.4)

Aus (6.4) erkennt man, dass das Stellgesetz sich als linearer Zustandsregler des adjungiertenZustandes b ergibt. Um diesen zu ermitteln muss das reduzierte Modell für ae vorwärts inder Zeit mit den Anfangsbedingungen ae(0) = a0 und anschliend das reduzierte Modell fürb rückwärts in der Zeit mit der Endbedingung b(tf ) = 0 gelöst werden. Die genannte End-bedingung ergibt sich aus der Endbedingung der adjungierten PDE mit λ = 0. Aufgrund derhomogenen Randbedingung der adjungierten PDE werden für diese keine homogenisierendenBasisfunktionen benötigt. Der Ansatz, die Basisfunktionen in ϕ und ψ aufzuteilen, entsprichtder physikalisch motivierten Modellreduktion zum Umgang mit Mehrdimensionalität. DiesesVerfahren scheint hier sinnvoller, da es gut möglich ist, dass λ und v – je nach Ausgestaltungder Optimierungsproblems – unterschiedlich viele Basisfunktionen zur adäquaten Darstellungbenötigen. Die unterschiedliche Handhabung beider Gleichungen zeigt sich ebenso in derZeitkoordinate und den Randbedingungen.

6.2 Bestrafen von Stellgrößenänderung und Regelfehler

Vom Verfahren der MPR her ist die Methode bekannt, statt des absoluten Stelleingriffs udie Stellgrößenänderung im Gütefunktional zu bestrafen. Diese Idee scheint aus zwei Gründenauch für den Reglerentwurf über die Modellreduktion der optimalen Steuerung sinnvoll. Ers-tens treten die Effekte, die als Motivation zur Bestrafung der Stellgrößenänderung im Falleder MPR dienen, auch im Falle der optimalen Steuerung von PDEs auf: So ist beispielsweiseaus den Arbeiten in [43] bekannt, dass der geschlossene Regelkreis zu starkem und schlechtgedämpftem Schwingen neigt, wenn auf eine Penalisierung von u verzichtet wird. Zweitenswird die Ableitung der Stellgröße u für die Berechnung des reduzierten Modells der Regel-strecke benötigt. Wird in der Regelstrategie nur u und nicht u berücksichtigt, kann dies zustarken Ausschläge in u führen, was die numerische Stabilität der Simulation der reduziertenModelle gefährdet. Umgekehrt stellt die Formulierung des Optimalsteuerungsproblems überu anstelle von u keine effektive Einschränkung des Lösungsraums von u dar, da u für dasreduzierte Modelle der Regelstrecke sowieso differenzierbar gewählt werden muss.

87

Page 100: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

6 Angepasste Methoden der optimalen Regelung

Ersetzt man – am Beispiel der Burgersgleichung – im Gütefunktional u durch u, so mussdas Optimierungsproblem mit u als Entscheidungsvariablen gelöst werden. Führt man hierzuw = u als neue (fiktive) Stellgröße ein, entsteht die zusätzliche Nebenbedingung

t∫0

w(τ) dτ − u(t) + u(0) = G(w,u) = 0, (6.5)

was einen weiteren Lagrange-Multiplikator κ(t) notwendig macht. Dieses κ(t) ist nicht von xabhängig, da u und w als Stellgrößen am Rand ebenfalls nicht von x abhängen. Bei verteiltenStelleingriffen muss das Vorgehen entsprechend angepasst werden. Für die Lagrangefunktionergibt sich dann

L(v,w,λ) =tf∫

0

12Q〈v, v〉L2 + R

2 w2 − 〈λ, v + ∂v

∂xv − µ∂

2v

∂x2 〉L2 − κ(t)G(w,u) dt. (6.6)

Nun muss für die KKT-Bedingung zusätzlich die partielle Ableitung ∂L∂w

ausgewertet werden.Dies führt zu

Rw + κ(t)∂G(w,u)∂w

= Rw + κ(t) · t != 0. (6.7)

Des Weiteren ändert sich noch die partielle Ableitung nach u zu der Gleichung

κ(t)∂G(w,u)∂u

= −κ(t) = µ∂λ

∂x(t, 0). (6.8)

Setzt man beide Gleichungen ineinander ein und integriert w zu u auf, so ergibt sich das neueStellgesetz

u(t) = u(0) + µ

R

(∂ψ(0)∂x

)T t∫

0

τ ·b(τ) dτ

. (6.9)

In (6.9) erkennt man eine MPR-artige Struktur, da die Stellgröße des letzten Zeitschrittes u(0)zunächst übernommen wird, um sie durch einen Faktor zu modifizieren. Diese Analogie desRegelgesetzes zur MPR unterstützt auch das Vorgehen, nur eine Newton-Iteration vorzuneh-men und die dort ermittelte Stellgröße direkt an den Prozess weiterzugeben. Der Hintergrunddieses Vorgehen bei der MPR ist die Tatsache, dass die Newton-Iteration über den ermittel-ten Gradienten der Abstiegsrichtung des Gütefunktional folgt. Dann kann es aber sinnvollersein, direkt ein u, was suboptimal ist aber zu einer Verbesserung führt, an den Prozess wei-terzugeben, als lange zu warten um dann ein optimales u zu applizieren, da das optimale u

88

Page 101: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

6.2 Bestrafen von Stellgrößenänderung und Regelfehler

aufgrund des höheren Rechenzeitbedarfs veraltet und daher ebenfalls nicht (mehr) optimal ist.

Neben der Bestrafung von u anstelle von u besitzt die Gütefunktion der klassischen optimalenSteuerung noch einen weiteren Term, von dem zweifelhaft ist, ob er für die vorgeschlageneReglerstruktur direkt übernommen werden sollte. Im bisherigen Gütefunktional wird der ge-samte Verlauf der verteilten Größe v(t,x) verwendet. Üblicherweise besteht das Ziel einesReglers aber nicht nur darin, die verteilte Größe gegen Null zu führen (und damit Störun-gen zu unterdrücken), sondern auch, dass definierte Regelgrößen y(t) ihren Referenzen r(t)folgen. Dabei kann y sowohl eine auf v(t,x) verteilte Größe y(t,x) sein als auch eine (end-liche) Menge von Eigenschaften, die als Vektor y(t) zusammengefasst werden können. Umdiese Flexibilität adäquat darzustellen, wird – analog zur Ausgangsmatrix C der klassischenZustandsraumdarstellung – der Ausgangsoperator C : L2(T , Ω) → Y eingeführt, der die imBochner-Raum lebenden Lösungen v(t,x) auf die Regelgrößen im Raum Y abbildet. FürY = L2(T , Ω) und C gleich der Identität ergibt sich die bisherige Gewichtung der verteiltenGröße, weshalb die Einführung des Ausgangsoperator als Generalisierung verstanden werdenkann. Die Anforderung, mit den Regelgrößen einer Referenztrajektorie zu folgen kann nun ana-log zur MPR dadurch umgesetzt, dass anstelle von 〈v,Qv〉L2 der Term 〈C(v)− r, C(v)− r〉Ymit dem auf Y definierten Skalarprodukt 〈·, ·〉Y verwendet wird. Dieses Skalarprodukt ist da-bei nicht bezüglich der Zeitkoordinate anzuwenden, so dass 〈C(v)−r,Q(C(v)−r)〉Y – analogzu 〈v,Qv〉L2 eine Funktion der Zeit t ist. Die KKT-Bedingungen modifizieren sich durch dasEinführen des Ausgangsoperators dergestalt, dass bei der Berechnung der partiellen Ableitungnach v sich über die Kettenregel die Formel

∂L∂v⇒ λ = −∂λ

∂xv − µ∂

∂x2 +Q (C(v)− r) ∂C∂v

(6.10)

ergibt. Bildet man hierzu das reduzierte Modell über die Galerkin-Projektion, so führt derneue Term auf den Ausdruck

ak = · · ·+ 〈Q(C(N+2∑i=1

ai(t)ϕi(x))− r)∂C∂v

,ϕk(x)〉L2. (6.11)

Für einen allgemeinen Operator C lässt sich dieser Ausdruck nicht weiter vereinfachen, wasdie Aufstellung des reduzierten Modells behindert, da das zum L2-Skalarprodukt gehörigeIntegral nicht offline berechnet werden kann. Beschränkt man sich hingegen auf lineare undzeitinvariante Operatoren C, so ergibt sich

ak = · · ·+ 〈Q(C(ϕ(x))∂C∂v

,ϕk(x)〉L2︸ ︷︷ ︸=Lak

ae(t)−〈Q∂C∂v

,ϕk(x)〉L2︸ ︷︷ ︸=gr

k

r(t). (6.12)

Während der Term La aus (6.3) nur modifiziert wird, folgt aus der Referenz der zusätzlicheVektor gr und die Eingangsgröße r in das Modell.

89

Page 102: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

6 Angepasste Methoden der optimalen Regelung

Diese unscheinbare Veränderung hat große Implikationen bezüglich der Methoden zu Erstel-lung des reduzierten Modells: Im Kapitel der POD wurde bereits diskutiert, dass bei einerVerwendung der POD zum Erstellen einer Regelung im Idealfall die Dynamik in der Stellgrö-ße u in den Snapshot-Daten beinhaltet ist, was zu einem iterativen Verfahren führt, da fürdie Berechnung der Regelung wiederum das reduzierten Modell benötigt wird. Ein ähnlichesProblem tritt durch das Auftauchen der Referenz r als Eingang im reduzierten adjungiertenProblem auf. Zur Berechnung der Basisfunktionen ψ werden Verläufe von λ als Snapshot-Daten benötigt. Für die numerische Lösung zum Generieren der Snapshot-Daten muss nichtnur v und damit u vorher festgelegt sein, sondern auch die Referenz r. Damit sind die Basis-funktionen ψ nur für eine vorher festgelegte Referenz optimiert und es ist nicht sichergestellt,ob die Basisfunktionen für andere Referenzen überhaupt gute Ergebnisse liefern können. DerEinfluss von r ist hier aber nicht so kritisch zu sehen, wie der Einfluss von u auf die PDEder Strecke, da es sich bei der adjungierten PDE zwar um eine zeitvariante aber dennochlineare PDE handelt. Stellt sich der Einfluss variierender Referenztrajektorien dennoch alsschwerwiegend heraus, kann dem Problem beispielsweise mit der in Abschnitt 4.2 vorgestell-ten Modellinterpolation begegnet werden, indem für verschiedene Referenztrajektorien dieBasisfunktionen ψ berechnet werden. Zwischen diesen kann dann bei Verwendung weitererReferenzen interpoliert werden, um angepasste Basisfunktionen zu erhalten. Da für dieseBerechnung lediglich die Basisfunktionen ψ neu berechnet werden müssen, hält sich der re-chentechnische Aufwand in Grenzen.

Ein weiterer Aspekt des Terms gr ist, dass die Referenz sich nur dann im reduzierten Modellniederschlägt, wenn die Basisfunktionen ϕ nicht orthogonal auf ∂C

∂vstehen. Das bedeutet,

dass nur die Teile der vorgegebenen Referenz umgesetzt werden können, die sich im Separa-tionsansatz durch ϕ auch abbilden lassen. Wird beispielsweise mit C(v) = v die Einregelungeines ortsverteilten Profils gefordert, so kann nur der Anteil von r, der nicht orthogonal zuϕ steht, berücksichtigt werden. Befindet sich r nicht in Uϕ ist stationäre Genauigkeit dahernicht zu erwarten.

6.3 Resultierende Gesamtstruktur

Mit den eingeführten Modifikationen des Gütefunktionals und der Einführung der reduziertenModelle ist der Regler vollständig beschrieben. Um die Lösung der reduzierten Modelle ermit-teln zu können, müssen aber die Anfangs- beziehungsweise Endbedingungen der gewöhnlichenDifferentialgleichungen bekannt sein. Da diese Zustände in der Regel für die Strecke nichtbekannt sind, müssen sie über einen Beobachter ermittelt werden. Aufgrund der homogenenEndbedingungen besteht diese Notwendigkeit für die Endbedingungen der adjungierten Glei-chung nicht. Daher ergibt sich die Ablaufstruktur der vorgeschlagenen Regelungsmethode zuder Folgenden (vergleiche dazu [89]):

Variablennameny Aktuelle Messung der Regelgröße(n)ae Zustand des reduzierten Modells der Regelstrecke

90

Page 103: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

6.3 Resultierende Gesamtstruktur

b Zustand des reduzierten Modells der adjungierten Regelstreckeu Stellgrößentrajektorie über dem Zeitintervall [0, tf ]r Referenztrajektorie

EinstellparameterQ Wichtung des RegelfehlersR Wichtung der Stellgrößenänderung utf Länge des Zeitfensters der Regelung

Initialisierungae(0)

[0 . . . 0 1 u(0)

]Tb(tf )

[0 . . . 0

]Tu

[u(0) . . . u(0)

]TAbschließendes Gütefunktional:

J(v(t,x),u(t)) =tf∫

0

12〈(C(v)− r) ,Q (C(v)− r)〉Y + 1

2uTRu dt (6.13)

mit den Nebenbedingungen v = F(v, ∂v, . . . , ∂αv) auf Ω und g(v, ∂v,u) = 0 auf ∂Ω.

Ablaufschema:

(1) Erhalt der aktuellen Messung y = C(v)

(2) Schätzen des Zustands ae(0) des reduzierten Modells der Regelstrecke

(3) Lösen der ODE des reduzierten Modells der Regelstrecke mit Anfangsbedingung ae(0)auf dem Intervall [0, tf ]

(4) Lösen der ODE des adjungierten reduzierten Modells auf [tf , 0] mit der Endbedingungb(tf ) = 0,

(5) Berechnen der neuen Stelltrajektorie u.

(6) Ausgabe von u(0) an die Regelstrecke.

Als Beobachter zum Schätzen kann beispielsweise ein hybrides erweitertes Kalmanfilter, wiees in Kapitel 4.3 beschrieben ist, verwendet werden. Schritt (6) des Ablaufschemas entsprichtdem Vorgehen der MPR und im vorliegenden Fall dem Abbruch der Optimierung nach einerNewton-Iteration. Die Formeln zum Berechnen der Schritte (3), (4) und (5) hängen von derpartiellen Differentialgleichung ab und sind für das Beispiel der Burgersgleichung im vorigenAbschnitt zu finden.

Der entstandene Regler gehört zur Klasse der optimalen Regler, da die Minimierung einesGütefunktional der Kernbestandteil ist, und zeigt in seiner Struktur Ähnlichkeit zur MPR.

91

Page 104: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

6 Angepasste Methoden der optimalen Regelung

Die drei Einstellparameter sind relativ intuitiv. Teil des Reglerdesigns ist zusätzlich zur Wahlder Reglerparameter die Umsetzung einer vernünftigen Modellreduktion von der Regelstreckeund der adjungierten PDE. Der Erhalt von Optimalität oder Stabilität kann durch den Reglernicht garantiert werden, da sowohl der Verzicht auf Iterationen mit dem modifizierten u alsauch die Verwendung von reduzierten Modellen eine Abweichung von der optimalen Steuerungbedeutet. Ist die Modellreduktion allerdings hinreichend genau, so ist zu erwarten, dass derüber die reduzierten Modelle errechnete negative Gradient des Gütefunktionals ebenfalls ineine Abstiegsrichtung des nicht reduzierten Systems deutet, wodurch die Regelung das Systemstabilisiert.

92

Page 105: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

In den vorangegangenen Abschnitten wurden zahlreiche neue Methoden vorgestellt und zwar:

(1) Das Ersetzen der POD durch nichtlineare Verfahren zu Modenbestimmung

(2) Das Interpolieren reduzierter Modelle durch Interpolation der Basisfunktionen

(3) Die Modelladaption durch Schätzen fiktiver Viskositäten mit einem Kalmanfilter

(4) Der Reglerentwurf durch Lösen der reduzierten Modelle des Optimalsteuerungsproblems

Auch wenn diese vier Methoden bei ihrer Herleitung und Erläuterung an der Burgersgleichungexemplifiziert wurden, steht eine Bewertung der Ergebnisse und die Anwendung auf realitäts-nahe Bedingungen noch aus. Dies soll im Folgenden geleistet werden, indem drei verschiede-ne Anwendungsbeispiele bemüht werden. Als erstes Beispiel dienen die 2D inkompressiblenNavier-Stokes-Gleichungen in verschiedenen Konstellationen. Wegen der Zweidimensionalitättreten für die Praxis wichtige aber auch verkomplizierende Effekte wie Turbulenz nicht auf,weshalb diese Beispiel unter dem Titel der mathematischen Strömungsmodelle in 7.1 geführtwird. An diesem werden alle vier Methoden untersucht. Die zugehörigen Publikationen desAutors sind [82, 83, 84, 85, 87]. Das zweite Beispiel kann als eine Erweiterung des erstengesehen werden. Hier wird die Methodik (1) auf realitätsnahe, hoch aufgelöste CFD-Daten(CFD=Computational Fluid Dynamics) einer turbulent überströmten und bewegten Ober-fläche angewandt. Die zugehörige Publikation des Autors ist hier [88]. Um die Variabilitätund generelle Verwendbarkeit der neuen Methoden zu unterstreichen bildet das letzte An-wendungsbeispiel einen Kontrapunkt zu den ersten beiden. Hier wird das optimale Be- undEntladen eines thermischen Festbettspeichers als andersartiger Strömungsprozess betrachtet.Die zugehörige Publikation des Autors für dieses dritte Beispiel ist [89].

7.1 Mathematische 2D-Strömungsmodelle

7.1.1 Einfache Nischenströmung

Die 2D inkompressiblen Navier-Stokes-Gleichungen ohne äußere Kräfte ergeben sich gemäß(2.8) zu

∂tv + (v ·∇)v − µ∆v +∇p = 0 mit div(v) = 0.

93

Page 106: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

Ein klassisches Problem für die Navier-Stokes-Gleichungen ist die Nischenströmung (sieheauch [83]), wie sie in Abbildung 7.1 dargestellt ist. An den drei Wänden unten, zur Rechtenund zur Linken wird die Geschwindigkeit in alle Richtungen als Dirichlet-Randbedingung zuNull gesetzt. Am oberen Ende des Rechengebietes ist die tangentiale Geschwindigkeit in x1-Richtung identisch u und die Geschwindigkeit in x2-Richtung Null. Diese Konstellation vonRandbedingungen tritt besonders beim Überströmen von Nischen oder Kavitäten auf.

Wand

u

x1

x2

Abbildung 7.1: Darstellung einer Nischenströmung in 2D

7.1.1.1 Reduziertes Modell

Die Modellreduktion wird nicht physikalisch motiviert vorgenommen, das heißt, sie wird fürdie beiden Geschwindigkeitskomponenten gemeinsam durchgeführt. Als Homogenisierungs-mode wird die stationäre Lösung des Problems für die Anströmung mit u = 1 verwendet. Dadiese Mode dem mittleren Strömungsfeld vergleichsweise nahekommt wird auf das Heraus-rechnen des zeitlichen Mittels über eine weitere Mode verzichtet, die wegen der homogenenRandbedingungen an allen Wänden nicht notwendig ist. Die numerische Lösung der Nischen-strömung erfolgt mit dem an die Problemstruktur minimal angepassten quelloffenem Lösermit18086navierstokes.m in [106]. Dieser Löser behandelt die nichtlinearen Terme explizit übereine Kombination zentraler Differenzen mit einem Upwinding Ansatz [29], während der Vis-kositätsterm implizit aufgelöst wird. Für die Simulation der Nischenströmung wurden 10210Gitterpunkte in einer rechteckigen Anordnung verwendet.

Das reduzierte Modell ergibt sich gemäß Galerkin-Projektion und unter Vernachlässigung desDruckgradienten (siehe [53]) von der Struktur identisch zur Burgersgleichung (3.11) zu

a = aeqae + µLae + gu (7.1)aN+1 = u

94

Page 107: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

mit den im Vergleich zu (3.12) leicht veränderten Tensoren, Matrizen und Vektoren

qijk = −〈(ϕi(x) · ∇)ϕj(x),ϕk(x)〉L2

Lik = 〈∆ϕi(x),ϕk(x)〉L2 (7.2)gk = −〈ϕN+1(x),ϕk(x)〉L2.

Die Snapshot-Daten, die als Grundlage der Modellreduktion dienen, wurden durch eine Si-mulation des Systems von 10 sec mit einem Anfangszustand, wo die Strömung überall gleichNull war, und der Anregungsfunktion

u(t) =

1− e−5t für t ≤ 7 sece−5t für t > 7 sec

(7.3)

generiert. Die Wahl von u(t) als Sprungantwort eines PT1 ermöglicht dabei, da u in das re-duzierte Modell eingeht, eine numerisch stabilere Integration der reduzierten Modelle. DurchEinführen des fiktiven Eingangs w mit u = 5(w − u) kann die beschriebene Anregungs-funktion durch Vorgabe des Endwertes des PT1 im reduzierten Modell einfach und stabilrealisiert werden. Bei einer Abtastzeit von 0, 1 sec ergeben sich die Dimensionen Nt = 101und Nx = 20420. Die Basisfunktionen wurden mit POD, Sammon-Projektion, Isomap, La-placian Eigenmaps und dem Autoencoder durchgeführt. Als Validierungsdatensatz wurdenzunächst Daten mit fünf anderen Anregungsfunktionen wie unter anderem

uval(t) =

(e−5t − 1) für t ≤ 7 sec0.5− 1.5e−5t für t > 7 sec

, (7.4)

was einer Strömung in entgegengesetzter Richtung zu den Snapshot-Daten entspricht, auf-genommen. Die folgenden Ergebnisse zeigen den Mittelwert der Resultate für alle fünf Anre-gungen. Als Fehlermaß wird dabei der relative quadratische Approximationsfehler gemäß derPOD-Definition verwendet, das heißt

e =[‖v(t,x)−

N+1∑i=1

ai(t)ϕi(x)‖2L2]T

[‖v(t,x)‖2L2]T

. (7.5)

Die Angabe des Fehlermaßes erfolgt stets in Prozent. Da dieses Fehlermaß dasjenige ist, wel-ches von der POD über die Snapshot-Daten minimiert wird, ist es am besten dazu geeignet,die mögliche Verbesserung der neuen Methoden gegenüber der POD zu belegen. Das Feh-lermaß kann dabei für die Basisfunktionen der unterschiedlichen Methoden, aber auch fürdie projizierte oder die durch Lösen des reduzierten Modells simulierten Koeffizienten berech-net werden. Außerdem ist die Berechnung für die Snapshot-Daten und die Validierungsdatenmöglich. Der Fehler wird dementsprechend mit Indizes versehen.

95

Page 108: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

Für die Auswahl der Anzahl der Basisfunktionen über den RIC und die Qualität der PODergibt sich zunächst für die Viskosität von µ = 0, 01:

POD RIC eprojsnap esimsnap eprojval esimvalN = 2 98.95 % 0, 26 0, 42 53, 92 61, 44N = 3 99.67 % 0, 08 0, 23 37, 61 41, 87N = 4 99.86 % 0, 03 0, 20 24, 00 25, 09N = 5 99.94 % 0, 02 0, 18 22, 28 23, 60N = 6 99.98 % 0, 01 0, 17 21, 18 21, 76

Die Angaben des Fehler sind (wie erwähnt) in Prozent gegeben. Im Folgenden wird für alleMethoden die Modenanzahl N = 4 gewählt. Aus den dargestellten Fehlern ist ersichtlich,dass, während der Wechsel von N = 3 nach N = 4 noch eine signifikantere Verbesserung fürdie Validierungsdaten mit sich bringt, eine weitere Steigerung von N nur zu einer marginalenReduzierung der Fehler führt. Die Probleme der POD für den nichtlinearen Strömungsprozessder Nischenströmung werden bereits bei der Betrachtung der Fehler für die Validierungsdatendeutlich, die sich in Bereich von etwa 25 % bewegen, was für eine gute Regelung in der Re-gelung nicht ausreichen wird. Zudem entsteht dieser Fehler, obgleich der RIC von über 99 %auf eine gute Modellreduktion hindeutet. Wie zu erwarten ist der auf die simulativ ermitteltenKoeffizienten bezogene Fehler stets größer als der über die projizierten Koeffizienten ermittel-te. Die Unterschiede sind hier für N ≥ 4 recht klein, was darauf hindeutet, dass die Moden,welche für die korrekte dynamische Beschreibung der anderen Moden benötigt werden, abN = 4 größtenteils im reduzierten Modell enthalten sind.

7.1.1.2 Iterative Verfahren

Für den Vergleich mit der Sammon-Projektion ergeben sich folgende Ergebnisse:

Methode eprojsnap esimsnap eprojval esimvalPOD 0, 03 0, 20 24, 00 25, 09

Sammon 0, 04 0, 22 23, 75 24, 59

Die Sammon-Projektion wurde dabei mit der POD als Startlösung initialisiert es wurden undgleichfalls N = 4 Basisfunktionen verwendet. Die Anzahl der Iterationen wurde über ein Ab-bruchkriterium bezüglich der Gradientensteigung festgelegt, das so klein gewählt wurde, dassvon einer vollständigen Konvergenz der Lösung ausgegangen werden kann. Wie zu erwartenist die POD für die projizierten Snapshot-Daten am besten, da sie eben genau diesen Fehlerminimiert. Dies überträgt sich in diesem Beispiel auch auf die Koeffizienten. Auf den Validie-rungsdaten scheint die Sammon-Projektion die Ergebnisse der POD zu verbessern, aber dieUnterschiede sind von einer Größenordnung, die keinen validen Schluss auf eine tatsächlicheVerbesserung zulässt. Möglicherweise handelt es sich aufgrund der geringen Abweichungenbei den Ergebnissen bei der POD ansatzweise um ein lokales Minimum für die Gütefunktion

96

Page 109: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

der Sammon-Projektion.

Der Autoencoder wurde mit einer Anzahl von 100 Iterationsschritten trainiert um ein Überler-nen zu verhindern. Als Aktivierungsfunktion wurde der tanh verwendet, welcher die in 4.1.4formulierter Bedingungen erfüllt. Die Initialisierung wurde wie beschrieben mit dem Einstell-parameter δ durchgeführt:

δ eprojsnap esimsnap eprojval esimvalPOD 0, 03 0, 20 24, 00 25, 090,2 0, 03 0, 21 24, 01 25, 114 0, 04 0, 20 23, 43 23, 9520 0, 05 0, 23 30, 68 57, 04

Für δ = 0, 2 ergeben sich quasi keine Abweichungen durch die Verwendung des Autoenco-ders. Hier wird das Künstliche Neuronale Netz zu sehr in seinem linearen Bereich initialisiert.Als nichtlineare Variante der klassischen PCA führt die Initialisierung im linearen Bereich da-zu, dass das iterative Verbessern des Netzes nahe eines lokalen Optimums gestartet wird,wodurch sich keine wesentlichen Änderungen ergeben. Dieser Effekt scheint ähnlich zu dembei der Sammon-Projektion identifizieren Effekt zu sein. Für hohe δ hingegen reichen die100 Iterationen nicht aus, um auf ein vernünftiges reduziertes Modell zu kommen. Dies istdadurch begründet, dass der tanh für hohe Werte nur eine sehr geringe Steigung aufweist.Dadurch wird die entsprechende Sensitivität sehr klein, was die Konvergenz numerischer Op-timierungsalgorithmen beeinträchtigt. Für eine korrekte Wahl von δ wird der Autoencoderjedoch in einem Bereich außerhalb des lokalen Minimum mit ausreichender Sensitivität in-itialisiert. Die sich dadurch ergebenden Resultate sich besser als die der POD für die Validie-rungsdaten. Bei einer Verbesserung von etwa 1 % befinden sie sich aber immer noch in einerGrößenordnung, die es verhindert, eine große Signifikanz zu konstatieren. Auch wenn bei deniterativen Verfahren und Künstlichen Neuronalen Netzen keine wesentliche Verbesserung derModellreduktion festgestellt werden konnte, so macht dies die methodische Einbettung dieserVerfahren nicht unnütz. Die Resultate der verwendeten Dimensionsreduktionsmethoden sindstets problemspezifisch und gerade bei den KNNs, für welche als intensivem Forschungsgebietimmer wieder Fortschritte zu verzeichnen sind, ist es gut denkbar, dass andere, modernereAlgorithmen und Verfahren in Zukunft bessere Ergebnisse liefern. Dann steht die generelleStruktur, die in dieser Arbeit dargelegt wurde bereit, um diese Algorithmen effektiv mit derGalerkin-Projektion zu verknüpfen.

7.1.1.3 Graphenbasierte Verfahren

Während die beiden bisher betrachteten Methoden nur geringfügige Verbesserungen erzielenkonnten, sind bei den graphenbasierten Methoden bei richtiger Parametrierung deutlichereGenauigkeitsgewinne zu verzeichnen. Für die Laplacian Eigenmaps ergeben sich für δ = 1000und der analog zur POD gewählten Metrik d (vj,vi) = 〈vj − vi,vj − vi〉L2 die folgendenErgebnisse:

97

Page 110: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

LEM-ε eprojsnap esimsnap eprojval esimvalPOD 0, 03 0, 20 24, 00 25, 097, 97 % 0, 98 1, 11 39, 68 41, 5611, 01 % 0, 61 0, 74 39, 12 40, 9013, 69 % 0, 25 0, 46 41, 24 50, 2525, 38 % 0, 10 0, 29 20, 03 22, 6844, 51 % 0, 06 0, 24 19,31 20,9960, 57 % 0, 14 0, 37 19, 91 22, 4786, 64 % 0, 09 0, 31 25, 87 28, 08

LEM-k eprojsnap esimsnap eprojval esimvalPOD 0, 03 0, 20 24, 00 25, 095, 91 % 0, 20 0, 36 38, 51 39, 7811, 79 % 0, 19 0, 43 18, 61 22, 1925, 20 % 0, 25 0, 49 17, 91 19, 7139, 51 % 0, 24 0, 49 17, 67 20, 2353, 10 % 0, 17 0, 39 17,39 18,9964, 71 % 0, 30 0, 55 18, 06 19, 4883, 53 % 0, 24 0, 48 18, 33 20, 91

Die Unterteilung in LEM-ε und LEM-k trennt zwischen den beiden eingeführten Nachbar-schaftsdefinitionen, wo entweder Punkte mit einem Abstand kleiner gleich ε oder die nächstenk Punkte als Nachbarn definiert werden. Der in der ersten Spalte aufgeführte Wert gibt dabeinicht die konkrete Wahl von ε oder k an, da diese stark von den Snapshot-Daten und ihrerSkalierung abhängt und die Vergleichbarkeit beider Verfahren sehr unintuitiv macht, sonderndie Prozentsatz der Knoten des Graphen, die miteinander verbunden sind. Dieser Wert wirdim Folgenden auch als Verknüpfungsgrad bezeichnet. Der Wert δ wurde zunächst sehr hochgewählt, um einen Einstellparameter weniger zu haben, da für hohe δ die Adjazenzmatrixverwendet wird.

Es ist klar erkennbar, dass die Laplacian Eigenmaps die Qualität des reduzierten Modells fürden Validierungsdaten für eine geeignete Wahl des Verknüpfungsgrades stark verbessern kann.Die Verbesserung erreicht dabei bis zu 25 %. Die damit verbundene Qualität der reduziertenModelle kann bei einer Verwendung der POD nicht durch Wahl einer leicht größeren Anzahlvon Basisfunktionen wie beispielsweise N = 5 oder N = 6 erreicht werden. Zu kleine Werteerhöhen jedoch den Fehler. Auf den Snapshot-Daten liefert natürlich nach wie vor die PODdie besten Ergebnisse, wobei die Verschlechterung durch die Verwendung der Laplacian Ei-genmaps nur marginal ist. Entscheidender Einflussparameter ist dabei insgesamt weniger dieWahl der Nachbarschaftsmethode, sondern primär der Verknüpfungsgrad, für den etwa 50 %ein guter Wert zu sein scheint. Dieser Wert gilt aber zunächst nur für die Nischenströmung:Für andere Systeme und Snapshot-Daten mögen andere Werte zielführender sein. Nichtsde-stoweniger scheint der Verknüpfungsgrad ein wichtiger Parameter zu sein.

Vergleich man die beiden Nachbarschaftsdefinitionen ε und k miteinander, so ist zu erkennen,dass die k-Methode insgesamt bessere Ergebnisse liefert. Auch wenn die ε-Methode für dieSnapshot-Daten leicht besser als die k-Methode abschneidet, so ist das Ziel der Modellreduk-tion ein Modell über den gesamten Arbeitsbereich zu erstellen. Hier schneidet die k-Methodeklar besser ab. Zudem ist die k-Methode weniger sensitiv gegenüber zu hohen Verknüpfungs-graden. Dieser Effekt konnte von der Literatur her erwartet werden, da – wie bereits erwähnt– bekannt ist, dass die ε-Methode für zu hohe Werte die Topologie der Mannigfaltigkeit nichtadäquat zu erfassen vermag [122]. Die Wahl von δ hatte in den hier präsentierten nume-rischen Untersuchungen nur sehr geringen Einfluss. Eine weitere Optimierung von δ konntehier nur eine weitere Verbesserung von maximal 0, 5 % einbringen, während zu kleine Werte

98

Page 111: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

für δ die Qualität massiv beeinträchtigten. Daher wird empfohlen, hohe Werte für δ oderdirekt die Adjazenzmatrix sowie die k-Methode zu verwenden. Diese Einstellungen werdenin den folgenden numerischen Untersuchungen mit den Laplacian Eigenmaps vorgenommen.Auch wenn das Einstellen der zahlreichen Parameter einen hohen Rechenaufwand zu bedeu-ten scheint, so hält sich dieser dadurch in Grenzen, dass nach einer Festlegung der Metrikdie rechenaufwendige Operation, die Abstände aller Snapshots untereinander zu berechnen,nur einmal durchgeführt werden muss. Die verbleibenden Einstelloptionen operieren nur aufdieser Abstandsmatrix und können vergleichsweise schnell durchgeführt werden.

Als Gegenüberstellung zu den Laplacian Eigenmaps wurde für die identischen Nachbarschafts-beziehungen gemäß der k-Methode die Dimensionsreduktion über die Isomap berechnet. Da-bei ergaben sich die folgenden Resultate:

LEM IsomapVerknüpfung eprojsnap esimsnap eprojval esimval eprojsnap esimsnap eprojval esimval

5, 91 % 0, 20 0, 36 38, 51 39, 78 0, 19 0, 40 50, 23 52, 0911, 79 % 0, 19 0, 43 18, 61 22, 19 0, 21 0, 41 32, 12 33, 1325, 20 % 0, 25 0, 49 17, 91 19, 71 0, 27 0, 51 29, 97 30, 2939, 51 % 0, 24 0, 49 17, 67 20, 23 0, 27 0, 51 24, 31 25, 0353, 10 % 0, 17 0, 39 17, 39 18, 99 0, 23 0, 40 21, 80 22, 7164, 71 % 0, 30 0, 55 18, 06 19, 48 0, 19 0, 42 16, 73 18, 2383, 53 % 0, 24 0, 48 18, 33 20, 91 0, 23 0, 47 20, 55 22, 48

Die Isomap ist in der Lage eine ähnliche Verbesserung wie die Laplacian Eigenmaps zu er-reichen. Die bestmögliche Verbesserung für die Validierungsdaten ist sogar besser als dieder Laplacian Eigenmaps. Dafür treten die großen Verbesserungen erst für höhere Verknüp-fungsgrade auf. Dies kann so verstanden werden, dass ein Verbinden von mehr Punkten dengeodätischen Abstand der einbettenden Mannigfaltigkeit der Nischenströmung besser abzu-bilden scheint, während ein Berücksichtigen von zu vielen Nachbarn die Laplacian Eigenmapsdie wesentlichen Nachbarschaften tendenziell übersehen lässt. Es ist aber auch zu beobachten,dass das Parameter-Fenster für eine deutliche Verbesserung der Ergebnisse im Vergleich zurPOD für die Isomap vergleichsweise schmal ist. Offensichtlich treten bei zu wenig Nachbarn –eventuell durch Phänomene wie fehlender geodätischer Konvexität bei zu wenig Nachbarn ver-ursacht – massive Abweichungen bei der Approximation des geodätischen Abstands zu Tage.Bei zu vielen Nachbarn hingegen werden Punkte miteinander verbunden, die eigentlich zu weitvoneinander entfernt sind. Auch wenn die Isomap die absolut betrachtet besten Ergebnisse zuliefern vermag, zieht der Autor der Laplacian Eigenmaps vor, da diese weniger sensitiv gegen-über den Einstellenparametern sind. Dadurch sinkt die Gefahr, dass das methodische Vorgehender Modellreduktion letzten Endes zu einem Herumfrickeln an den Nachbarschaftsdefitionenverkommt. Im Falle einer Verwendung der Isomap führen tendenziell größere Werte für kzu den besseren Ergebnissen. Die Tatsache, dass die beiden graphenbasierten Verfahren, diezu den topologieerhaltenden Methoden gehören, am besten abschneiden, unterstreicht noch-mals die Tatsache, dass die Behandlung der Dimensionsreduktion über Mannigfaltigkeiten für

99

Page 112: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

nichtlineare Strömungsprozesse angezeigt ist.

Auch wenn bei Verfahren der Modellreduktion als Operationen der offline Phase Rechenzeitnicht die Priorität wie bei Echtzeitanwendungen genießt, ist es für den Anwender dennochwichtig, eine Abschätzung der Rechenzeiten – insbesondere im Vergleich zur etablierten POD– zu erhalten. Die graphenbasierten Verfahren haben dabei eine Rechenzeit in der Größen-ordnung der POD und verhalten sich bezüglich der Dimensionen N , Nx und Nt gleich wiedie POD. Zeitaufwendig kann hier das händische Optimieren der Parameter sein, dass imVergleich zur POD einen zusätzlichen Zeitaufwand bedeutet, der aber nicht immens ist, dadie Abstandsmatrix bei fester Metrik nur einmal berechnet zu werden braucht. Die iterativenVerfahren hingegen zeigten für den Anwendungsfall Rechenzeiten, die in etwa das hundert-fache der POD betrugen, sofern viele Iterationen durchgeführt wurden. Während sich derAutoencoder bezüglich der Dimensionen ähnlich wie die POD verhält, ist für die Sammon-Projektion insbesondere der Wert N kritisch. Hier konnte für N = 5 die Optimierung derSammon-Projektion auf einem herkömmlichen Rechner von 2014 nicht mehr innerhalb von24 Stunden gelöst werden.

Ein weiterer Aspekt der Analyse ist das Verhalten der Methoden bezüglich einer Variationder Reynoldszahl beziehungsweise der Viskosität. Da mit der einer Erhöhung der Reynolds-zahl der nichtlineare Charakter der partiellen Differentialgleichung steigt, kann eine stärkereKrümmung des nichtlinearen Raumes vermutet werden. In diesem Kontext kann die These auf-gestellt werden, dass die relative Verbesserung im Vergleich zur POD durch die Verwendungnichtlinearer Dimensionsreduktionsmethoden für steigende Reynoldszahlen beziehungsweisesinkende Viskositäten größer werden sollte. Numerische Untersuchungen wurden dahingehendfür die Laplacian Eigenmaps mit der k-Methode und einem Verknüpfungsgrad von etwa 50 %,N = 4 Basisfunktionen und dem Fehler esimval durchgeführt.

µ POD LEM relative Verbesserung1/100 25, 09 18, 99 24, 31 %1/200 42, 89 33, 10 22, 82 %1/300 54, 25 44, 18 18, 56 %1/400 61, 64 52, 40 15, 00 %1/500 67, 09 59, 14 11, 86 %

Die Laplacian Eigenmaps liefern nach wie vor bessere Ergebnisse als die POD. Erwartungs-gemäß steigt mit der Erhöhung der Nichtlinearität der Fehler der POD an. Die aufgestellteThese lässt sich allerdings nicht belegen, da die relative Verbesserung durch die Verwen-dung der nichtlinearen Methoden geringer wird. Eine mögliche Erklärung hierfür ist, dassfür geringere Viskositäten anderen Verknüpfungsgrade notwendig sind, um die bestmöglicheVerbesserung zu erzielen. Auch ist es denkbar, dass durch die steigende Nichtlinearität dieeinzubettenden Mannigfaltigkeit derart nichtlinear wird, dass mehr Basisfunktionen verwendetwerden müssen als zuvor.

100

Page 113: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

Bezüglich der Anzahl an Basisfunktionen wurde bei der Erläuterung der nichtlinearen Me-thoden darauf hingewiesen, dass mit Bezug auf den Einbettungssatz von Whitney nur einemaximale Halbierung der Modenanzahl der POD sinnvoll erwartet werden kann. Diese Ver-mutung wurde durch das Berechnen der POD und der Laplacian Eigenmaps und der Isomapfür eine Modenanzahl von N = 3 bis N = 14 untersucht. Der Fehler eprojval ergab sich beigeeigneter Wahl der Einstellparameter wie in Abbildung 7.2 gezeigt. Im Gegensatz zu dervorherigen Analyse, wo esimval Verwendung fand, wurde hier der Projektionsfehler gewählt, umdie differentialgeometrische Aussage besser bewerten zu können. Der Einstellparameter k fürdie Nachbarschaftbeziehungen ergab sich für N = 3 und N = 5 zu einem sehr ähnlichenVerknüpfungsgrad. Für anderen Modenanzahlen mussten leicht andere Verknüpfungsgradegewählt werden, die sich jedoch in ungefähr derselben Größenordnung befanden.

N

10

15

20

25

Fehl

er

4 5 6 7 8 9 10 11 12 13 143

IsomapLEMPOD(2N)POD(N)

Abbildung 7.2: Projektionsfehler auf die Validierungsdaten für verschiedene N und Methoden

Aus Abbildung 7.2 wird ersichtlich, dass beide graphenbasierten Verfahren der maximal sinn-voll zu erwartenden Einsparung in dem betrachteten Bereich sehr nahe kommen. Diese Bot-schaft unterstreicht den richtigen Ansatz, nichtlineare Dimensionsreduktionsverfahren mit derGalerkin-Projektion zu einer nichtlinearen Modellreduktion für nichtlineare Strömungsprozessezu kombinieren.

7.1.2 Doppelte Nischenströmung

Das erste Beispiel hat mit einer detaillierten numerischen Studie die Mächtigkeit der Ver-wendung nichtlinearer Modellreduktionsmethoden aufgezeigt. Damit liegt ein verbessertesWerkzeug zur Modellierung vor. Diese Modelle müssen jedoch auch in Regelungen integriertwerden, wovon – auch wenn ein neuartiges Regelungsverfahren in dieser Arbeit vorgestelltwurde – eine Vielzahl von Reglern profitieren kann. Zur Erprobung von Reglern wird die

101

Page 114: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

vorherige wohlbekannte Nischenströmung zu einem komplexeren System verändert, das inAbbildung 7.3 gezeigt ist.

Wand

Wandz u

x1

x2

y

Abbildung 7.3: Darstellung einer doppelten Nischenströmung mit Stör-, Stell- und Regelgröße

Das Rechengebiet ist Ω =[0 2

]×[0 1

]Im Gegensatz zu vorherigen Nischenströmung

gibt es zwei ’Löcher’ am oberen Ende, wobei die tangentiale Geschwindigkeit rechts (Γ =[1.25 1.75

]× 1) durch die Stellgröße u und links (

[0.25 0.75

]× 1) durch die Störgröße

z vorgegeben wird. Regelgröße ist die mittlere Rotation des Strömungsfeldes in dem um-randeten Gebiet in der Mitte des Rechengebietes (Ωy =

[0.75 1.25

]×[0.4 0.6

]). Diese

Regelgröße wurde gewählt, da sie sich durch einen linearen Operator mit einfacher Ablei-tung darstellen lässt und sowohl durch u als durch z beeinflusst wird. Als Messgröße dientneben der Regelgröße eine zusätzliche Geschwindigkeitsmessung knapp unterhalb der Stör-größe, um diese effektiv schätzen zu können. Die beschreibenden Gleichungen sind analogzur einfachen Nischenströmung (2.8) und es wird derselbe numerischen Löser mit einer auf-grund des verdoppelten Rechengebietes verdoppelten Anzahl von Gitterpunkten verwendet.Die Anregungsfunktionen und die Integration derselben durch die fiktive Stellgröße w erfolgenebenfalls auf die gleiche Weise. Das reduzierte Modell ergibt sich wie im vorherigen Beispielin (7.1) und (7.2) mit der Ausnahme, dass für den Zustand ae neben der Stellgröße ebenfallsdie Störgröße z mit einer entsprechenden Homogenisierungsmode eingeht. Für diese Basis-funktion wird dabei die gespiegelte Basisfunktion für u verwendet. Aus denselben Gründenwie für die einfache Nischenströmung wird das Herausrechnen des zeitlichen Mittelwertesweggelassen.

7.1.2.1 Modellinterpolation

Zunächst soll das Konzept der Modellinterpolation an der doppelten Nischenströmung verifi-ziert werden. Als Parameter der Modellinterpolation wurde die Viskosität beziehungsweise dieReynoldszahl verwendet. Dazu wurden Snapshot-Daten für die vier verschiedenen Reynolds-zahlen 100, 150, 200 und 250 aufgenommen und damit vier verschiedene Basisfunktionenüber POD und vier reduzierte Modelle erstellt. Dabei kamen N = 8 Basisfunktionen ne-ben den Homogenisierungsmoden zum Einsatz, was für alle Viskositäten zu einem RIC von

102

Page 115: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

über 99 % führte. Drei der Basen wurden dann verwendet, um das reduzierte Modell für dieReynoldszahl 170 durch Interpolation zu finden. Als Methode kam dabei die vorgestellte Mo-dellinterpolation über Mannigfaltigkeiten mittels Geodäten zum Einsatz. Zur Bewertung desVerfahrens wurden als Validierung auch Snapshot-Daten für Re = 170 aufgenommen unddarüber das optimale Vergleichsmodell bestimmt. Als Fehlermaß kommt neben den bereitsverwendeten eproj und esim der neue Fehler eur mit

eur(ϕ,ψ) = N −N∑i=1

N∑j=1〈ϕi(x),ψj(x)〉2L2 (7.6)

hinzu, der ein Maß für die Ähnlichkeit von Unterräumen darstellt. Der Fehler eur nutzt dabeiaus, dass alle Basen orthonormal sind und sich daher die Parsevalsche Gleichung (das Analogondes Satzes von Pythagoras für Räume mit Skalarprodukt [124]) anwenden lässt. Damit stellteur die Länge der Basis ϕ dar, die orthogonal auf der Basis ψ steht. Ist ϕ sehr ähnlich zu ψ,so ergibt sich das Skalarprodukt für jede der N Basisfunktionen näherungsweise einmal zu 1und der Fehler verschwindet zu Null. Lässt sich hingegen ϕ nicht durch ψ darstellen, sindalle Skalarprodukte identisch Null und der Fehler wächst auf maximal N an. Damit ergebensich die folgenden Ergebnisse:

Modell erstellt für: c1 ·eproj c1 ·esim c2 ·eurRe = 100 12, 2958 15, 7549 13, 8940Re = 150 normiert = 1 2, 8838 normiert = 1Re = 170 0, 0043 1, 5586 0, 0000Re = 200 2, 1264 3, 2782 1, 9038interpoliert 0, 0044 1, 5940 0, 0098

Da sich die Prozentzahlen wegen der hohen Modenanzahl nur gering unterscheiden wurdendie Fehler zur besseren Vergleichbarkeit mit den Faktoren c1 und c2 normiert. Dabei wurdenbeiden Konstanten so gewählt, dass der ’best-guess’ ohne Modellinterpolation – das heißtdas für die Reynoldszahl Re = 150 erstellte Modell – zu 1 normiert wurde (siehe Tabelle).Es ist klar ersichtlich, dass die Modellinterpolation ein nahezu perfektes Ergebnis erreicht, dasich das interpolierte Modell nur marginal von dem bestmöglichen POD-Modell unterscheidet.Andererseits ist zu beobachten, dass die anderen Modelle je weiter sie sich von dem gesuchtenParameterwert entfernen immer schlechter werden.

Um das Konzept nicht nur für die Modellierung, sondern auch für die Regelung zu validierenwurden drei verschiedene modellprädiktive Regler A, B und C entworfen und deren Ergeb-nisse untereinander verglichen. Das Strukturbild von Regler C ist dabei in Abbildung 7.4dargestellt.

Die Nichtlineare MPR löst des Optimierungsproblem der MPR aufgrund des um die prädizier-te Zustandstrajektorie linearisierte Systems. Die freie Regelgröße wird mit dem nichtlinearenModell prädiziert. Das in Regler C verwendete Modell ist dasjenige, welches für die aktuelleReynoldszahl durch Modellinterpolation erstellt wurde. Dabei sind zukünftige Verläufe des

103

Page 116: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

z u

Re

y

q, L, g

r

[a z u]

BeobachterErweitertes

Kalmanfilter

ReglerNichtlineare

MPR

Interpolation

Modell-erstellung

Abbildung 7.4: Struturbild des Reglers C mit integrierte Modellinterpolation

Sollwertes r der MPR bekannt, zukünftige Werte der Reynoldszahl allerdings nicht. ReglerB unterscheidet sich nur in dem Punkt von Regler C, dass er statt das aktuelle Modell zuinterpolieren das Modell mit der nächsten Reynoldszahl verwendet, s dass der Regler zwischeninsgesamt vier verschiedenen Modellen hin- und herschaltet. Diese vier Modelle entsprechendamit den Stützstellen der Modellinterpolation für Regler C. Noch simpler agiert Regler A,der das Modell für Re = 100 verwendet. Der Prädiktionshorizont aller Regler beträgt 2 sec.Alle Einstellparameter sind bis auf das verwendete Modell identisch.

Für die Regler B und C muss je nach dem verwendeten Modell der Zustand umgerechnetwerden, da dieser für andere Basisfunktionen in einem anderen Koordinatensystem vorliegt.Dies kann aufgrund der Orthonormalität der Basisfunktionen (die homogenisierenden Basis-funktionen wurden für alle Modelle gleich gewählt) durch die Formel

ai =N∑j=1

ajϕTj ϕi. (7.7)

geschehen, wobei die bisherige Basis ϕ auf die neue Basis ϕ projiziert wurde, um den neuenZustand a zu erhalten. In (7.7) sind man ebenfalls gut den Einfluss des eingeführten Fehlerseur.

Zum Vergleich der drei Regler und der damit verbundenen Untersuchung des positiven Einflussder verbesserte Modelle qua Interpolation wurde der in Abbildung 7.5 und 7.6 dargestelltenumerische Versuch durchgeführt. Die Wahl der Trajektorie der Reynoldszahl erfolgte dabeinach dem Gesichtspunkt, Bereiche erwartbarer Verbesserung (130 für Interpolation und 300für Extrapolation) als auch geringem zu erwarteten Einfluss (205 und 100), wo jedoch die

104

Page 117: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

Regler A und B unterschieden werden können, zu schaffen. Die Ergebnisse zeigen, dass ge-nau diese erwarteten Effekte beobachtet werden können. Da 205 ≈ 200 gilt, variieren dortdie rote und grüne Linie nicht wesentlich, während der Regler A mit der blauen Linie we-sentlich schlechter abschneidet. Die Auswirkung der Modellinterpolation auf die Modellgütezeigt sich besonders beim zweiten und dritten Sprung, wo einzig Regler C ein wirklich gutesRegelergebnis ohne wesentlichen Überschwingen zu erzielen vermag.

0 10 20 30 40

−0 15,

0

0 15,

Zeit in Sekunden

y

Regler ARegler BRegler C

−0,3 100

205

300

130

SollwertRe

Abbildung 7.5: Führungsverhalten von Regler A, B und C bei veränderlicher Reynoldszahl

0

0 1,

y

8 12Zeit in Sekunden

24 26-0,1

0

y

Abbildung 7.6: Führungsverhalten von Regler A, B und C: Zoom

Neben dem Führungsverhalten wurde ebenfalls die Störgrößenunterdrückung aller drei Reglermiteinander verglichen – siehe Abbildung 7.7. Hier liefert erneut Regler C bei einer Reynolds-zahl von Re = 225 die besten Ergebnisse. Weiter zu beachten ist, dass für das Erstellen derSnapshot-Daten z konstant gehalten wurde, weshalb der Effekt von veränderlichen z nichtdirekt im reduzierten Modell enthalten ist. Dennoch besitzt die Modellinterpolation einenpositiven Effekt auf die Abbildung der Störung z im reduzierten Modell.

Zusammenfassend lässt sich sagen, dass die Modellinterpolation hervorragende Ergebnisse beider Verbesserung der Modellgenauigkeit liefert. Diese Verbesserung konnte durch die Einbin-

105

Page 118: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

5 10 15 20−0 1,

0

Zeit in Sekunden

y

0

Abbildung 7.7: Störgrößenunterdrückung von Regler A, B und C für Re = 225

dung der Modellinterpolation in die Struktur einer nichtlinearen modellprädiktiven Regelungauch auf die Regelgüte übertragen werden.

7.1.2.2 Optimale Regelung

Für die beschriebene doppelte Nischenströmung kann auch ein optimaler Regler nach demin 6 ausgeführten neuartigen Regelungskonzept ausgelegt werden. Das Gütefunktional wirdals

J(u,v) = 12

tf∫0

∫Ωy

rot (v)− r

2

+ R

2

tf∫0

u2 dt (7.8)

gewählt. Aufgrund der Forderung nach Inkompressibilität existieren zwei Gleichungsnebenbe-dingungen. Daher muss der Lagrangefunktion der zusätzliche Term κ2(x) div(v) hinzugefügtwerden, wobei κ2 dieselbe Dimension wie div(v) (also ortsverteilt und skalar) besitzt. Daherergibt sich die Lagrangefunktion zu

L = J−tf∫

0

〈λ, ∂∂tv+(v ·∇)v−µ∆v+∇p〉L2−κ1(t)G(w,u)−〈κ2(x), div(v)〉L2 dt (7.9)

mit G wie in (6.5) zur Berücksichtigen der Bestrafung von u. Die Ableitungen gemäß denKKT-Bedingungen müssen nun nach v, p, u, w, λ, κ1 und κ2 berechnet werden. Die Ablei-tung nach κ2 und λ ergeben erneut die Navier-Stokes-Gleichungen.

Leitet man nach dem Druck p ab, so ergibt sich bei Beachtung der Definition der Divergenz

∂p〈λ,∇p〉L2 = ∇ · λ = div(λ) = 0. (7.10)

106

Page 119: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

Damit ist der adjungierte Strömungszustand λ ebenso wie v divergenzfrei. Die adjungierteGleichung, welche aus der KKT-Bedingung für v resultiert, wird in analoger Weise zumVorgehen bei der Burgersgleichung durch das Aufteilen des Integrals in (hier fünf) verschiedeneTeile und das Anwenden der partiellen Integration berechnet. Dabei ergibt sich

tf∫0〈λ, ∂

∂tv + (v · ∇)v − µ∆v +∇p〉L2 + 〈κ2(x), div(v)〉L2 dt =

2∑j=1

tf∫0

∫Ω

(λj∂vj∂t︸ ︷︷ ︸A

+λj2∑i=1

∂vj∂xi

vi︸ ︷︷ ︸B

−µλj∆(vj)︸ ︷︷ ︸C

+λj∂p

∂xj︸ ︷︷ ︸D

+κ2(∇·v)︸ ︷︷ ︸E

)dx dt. (7.11)

Die partielle Integration für die Integral A bis E liefert zusammen mit dem Vertauschen derIntegrationsreihenfolgen, die nach dem Satz von Fubini möglich ist,

A :2∑j=1

∫Ω

λjvj

tf0

−tf∫

0

∫Ω

∂λj∂t

vj (7.12)

B :2∑i=1

tf∫0

∮∂Ω

λjvjvi −tf∫

0

∫Ω

∂λj∂xi

vjvi −tf∫

0

∫Ω

λj∂vi∂xi

vj

︸ ︷︷ ︸=0

(7.13)

C : µ

tf∫0

∮∂Ω

(λj∂vj∂n− vj

∂λj∂n

) +tf∫

0

∫Ω

vj∆(λj)

(7.14)

D :tf∫

0

∮∂Ω

λjp−tf∫

0

∫Ω

∂λj∂xj

p (7.15)

E :tf∫

0

∮∂Ω

κ2vj −tf∫

0

∫Ω

∂κ2

∂xjvj. (7.16)

Da ∂L∂vk

= 0 auf dem gesamten Rechengebiet gelten muss, ergeben sich die Terme

A : −∂λk∂t

; B : −2∑j=1

(∂λk∂xj

+ ∂λj∂xk

)vj ; C : µ∆(λk) ; E : ∇κ2. (7.17)

Setzt man diese mit den Anteilen aus J zusammen, so erhält man die adjungierte Gleichung

∂tλ = −(Dλ+DλT)v − µ∆(λ)−∇κ2 +

∫Ωy

rot (v)− r

∂C∂v

(7.18)

für λ, wobei die Ableitung des Operators C sich über die Ableitung der Rotation zu

107

Page 120: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

∂C

∂vx=

1 für Ωu

y

−1 für Ωoy

0 sonst

∂C

∂vy=

1 für Ωr

y

−1 für Ωly

0 sonst, (7.19)

berechnet, wobei die Indizierung den unteren, oberen, rechten und linken Rand von Ωy spe-zifiziert.

Die verbleibenden Größen, nach denen die Fréchet-Ableitung gebildet werden muss, sind u,κ1 und w. Da die Stellgröße u nur an dem Randteil Γ von Ω präsent ist, müssen hierfür dieRandintegrale betrachtet werden und es ergibt sich die Ableitung der Integralteile zu

B :tf∫

0

∮Γ

2λ1u+ (λ1 + λ2)v2 = 0 (7.20)

C : µtf∫

0

∮Γ

∂λ1

∂n= µ

tf∫0

∮Γ

∂λ1

∂x2.

Zusammen mit der analogen Rechnung für u wie im Rahmen von (6.5) ergibt sich mit denAbleitungen nach κ1 und w das Stellgesetz zu

u(t) = u(0)− µ

R

t∫0

∮Γ

τ∂λ1(τ)∂x2

. (7.21)

Der Regler ergibt sich dann über die reduzierten Modelle dieser Gleichungen. Für die Streckeergeben sich die um den konstant modellierten Zustand z erweiterten Gleichungen in (7.1)und (7.2). Die adjungierten Gleichungen werden über M Basisfunktionen mit

λM(x, t) =M∑i=1

bi(t)ψi(x), (7.22)

approximiert, was zu dem reduzierten Modell (vergleiche mit (6.2))

b = aeqabb+ µLbb+Laa+ grr(t) (7.23)

mit den Vektoren und Matrizen (vergleiche mit (6.3))

qabijk = −〈(Dψi(x) +DψT

i(x))ϕj(x),ψk(x)〉L2

Lbik = −〈∆ψi(x),ψk(x)〉Ω (7.24)

Laik = 〈C(ϕi(x))∂C∂v

,ψk(x)〉Ω

gk = −〈∂C∂v

,ψk(x)〉Ω.

108

Page 121: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

führt. Das Stellgesetz ergibt sich entsprechend als

u = u(0)− µ

R

M∑i=1

t∫0

βi(τ) · τ∮Γ

(∂ψ1

∂x2

)i

. (7.25)

Für das Erstellen der reduzierten Modelle wurde die POD verwendet. Über die Anregungs-funktion u(t) = (1− e10(2−t)) für t ≥ 2 wurde ausgehend von der für z = 1 sich ergebendenstationären Lösung die Strecke mit einer Viskosität von µ = 0, 01 und einer Abtastzeit von0, 01 sec über 15 sec simuliert, so dass 1501 Snapshots vorlagen. Die Simulation der adjungier-ten Gleichungen erfolgt mit diesen Simulationsdaten für v. Der Referenzwert wurde gleichdem Endwert der Regelgröße bei t = 15 sec. Im Gegensatz zur vorherigen Umsetzung desStellgröße über u = (w − u) wurde hier u = w gewählt, da dies dem Aufbau des Regelungs-konzeptes und der reduzierten Modelle entspricht. Die numerische Lösung des adjungiertenProblems erfolgte mit einer eigenständigen umgebauten Variante des MIT-Löser von Seibold[106]. Dieser konnte verwendet werden, da die Problemstruktur beider Gleichungen aufgrundder Divergenzfreiheit und der identischen Rolle von ∇p und ∇κ2 dieselbe ist.

Der RIC für die Strecke und die adjungierte Gleichung ergibt sich dabei wie in Abbildung 7.8dargestellt.

1 3 5 7

100%

Anzahl der verwendeten Basisfunktionen N/M

RIC

93%

Navier-StokesAdjungiert

Abbildung 7.8: Relativer Informationsgehalt RIC der POD

Auf Basis des RIC wurde N = 4 beziehungsweise M = 3 gewählt. Es wird deutlich, dassdie adjungierten Gleichungen weniger Basisfunktionen benötigen. Dies könnte daran liegen,dass es sich bei diesen um eine lineare zeitvariante statt um eine nichtlineare PDE handelt.Als homogenisierende Basisfunktionen wurde die Anfangslösung für z und die Differenz vonAnfangs- und Endlösung für u genutzt. Für die reduzierten Modelle ergeben sich die für aund b die simulierten (das heißt durch das Lösen des reduzierten Modells ermittelten) und dieprojizierten (das heißt durch Projektion der PDE-Lösung auf die Basisfunktionen ermittelten)Koeffizienten, wie sie in Abbildung 7.9 gezeigt sind.

Für die simulative Bestimmung von b wurde die simulierten Koeffizienten für a verwendet.Alle Verläufe stimmen sehr gut überein, lediglich die Koeffizienten a4 und b2 weisen kleine

109

Page 122: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

0 10Zeit in Sekunden

ai

−2 5 1502

8

14

46

1210 Basisfunktion 1

Basisfunktion 3Basisfunktion 4

projiziertsimuliert

10-3

0 10Zeit in Sekunden

bi

−2 5 1502

8

46

10 Basisfunktion 1Basisfunktion 2Basisfunktion 3

projiziertsimuliert

10-4

Basisfunktion 2

Abbildung 7.9: Projizierte und simulierte Koeffizienten für die ersten vier Basisfunktionen von aund b.

Abweichungen auf. Die Gesamtgüte der Wiedergabe ist aber sehr zufriedenstellend.

Das Verhalten des Regler im geschlossenen Regelkreis ist in Abbildung 7.10 gezeigt. DieAbtastzeit des Reglers war 0, 1 sec und tf wurde zu tf = 2 sec gewählt, da dies einen glattenaber schnellen Verlauf im geschlossen Kreis hervorrief. In 7.10 ist zunächst ein einfachesFührungsverhalten gezeigt, wobei im Zeitpunkt t = 12 sec die Störung z sich um ∆z =2 änderte. Diese Störung ist in den Snapshot-Daten die zur POD-Generierung verwendetwurden, nicht enthalten. Zu Vergleichszwecken und um die Regelfaktor des Regler besserbeurteilen zu können, wurde eine einfache statische Vorsteuerung berechnet, die den stationäreWert u∞ für u stellt, der zu einer Einregelung des Sollwertes ohne Störung führen würde.

0 10Zeit in Sekunden

y

5 15 20

Regelgröße für ReglerSollwert

0

−0,06

Regelgröße für Steuerung

Abbildung 7.10: Performanz des Reglers und Vergleich mit statischer Vorsteuerung.

Es ist klar erkennbar, dass der Regler in der Lage ist, sowohl die Regelgröße ohne bleibendeRegelabweichung und schneller als die statische Vorsteuerung einzuregeln und die Störung ef-fektiv zu unterdrücken. Das Verhindern der bleibenden Regelabweichung ist dabei analog zur

110

Page 123: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

MPR darauf zurückzuführen, dass durch die Berücksichtigung von z als Zustand der Reglerüber ein internes Störgrößenmodell verfügt, welches stationäre Genauigkeit erzwingt.

Dieser erste Benchmarktest ist aber nicht ausreichend um die Sinnhaftigkeit des eingeführ-ten Regelungkonzepts nachzuweisen. Entscheidend ist für dessen Bewertung, ob über dasLösen der reduzierten Modelle eine Stellgröße berechnet wird, die der tatsächlich optimalenStellgröße aus der optimalen Steuerung für PDEs nahekommt und gegen diese konvergiert.Hierzu wurde das Optimalsteuerungsproblem basierend auf (7.18) und (7.21) explizit ohne dieVerwendung reduzierter Modelle numerisch gelöst. Diese Lösung wurde in jedem Zeitschrittwiederholt durchgeführt und die Einstellparameter im Vergleich zum Regler mit reduziertemModell beibehalten. Der Unterschied zwischen der Stellgröße des Reglers ured und der opti-malen Stellgröße ohne Reduktion uPDE ist normiert auf den Wert der statischen Vorsteuerungu∞ in Abbildung 7.11 dargestellt. Es handelt sich dabei um den identischen Fall zu Abbildung7.10. Die Stellgröße über die PDE wurde nur als Vergleichszweck berechnet und nicht zumSchließen des Regelkreises verwendet.

Durch die Berücksichtigung von z im Modell der Regelstrecke verfügt auch der auf PDE-Basisberechnete Regler über ein Störgrößenmodell und vermeidet bleibende Regelabweichung. Da-her konvergiert der Unterschied zwischen beiden Stellgröße gegen Null. Allgemein ist derUnterschied sehr klein und tritt vor allem am Anfang und zum Zeitpunkt der unerwartetenStörung auf. Die Differenz bei der Störung kann dadurch erklärt werden, dass diese Störungnicht in den Snapshot-Daten abgebildet war. Dennoch ist auch hier die Konvergenz schnell.Die Abweichung am Anfang ist vermutlich auf die Verwendung eines Beobachters für denRegler mit reduzierten Modell zurückzuführen. Dieser schätzt im Rahmen seiner Initialisie-rung einen fehlerhaften Anfangszustand was zu einer abweichenden Stellgröße führt. Mit derKonvergenz des Beobachters konvergiert dann ebenfalls die Stellgröße gegen die über die PDEberechnete.

0 10Zeit in Sekunden

5 15 20

0

1

−2

−1

−3

u -uPDE red

in %

Abbildung 7.11: Vergleich der über die PDE und der über das reduzierte Modell ermittelten Stell-größen

111

Page 124: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

Insgesamt hat dieses Beispiel gezeigt, dass sowohl die Modellinterpolation als auch die Re-gelung über reduzierte Modelle für die adjungierten Gleichungen funktionieren. Dabei konntegezeigt werden, dass die Verbesserung der reduzierten Modelle durch die Modellinterpolationsich auch auf eine Steigerung der Regelgüte auswirkt, wenn diese in einem modellbasiertenRegelungsansatz wie beispielsweise der Modellprädiktiven Regelung eingesetzt werden. Fürdas Regelungskonzept konnte für den Anwendungsfall nachgewiesen werden, dass die überdas reduzierte Modell berechnete Stellgröße der über die PDE ermittelten sehr nahe kommt,da die Abweichung im untersuchten Fall unter 3 % lag.

7.1.3 Einfache überströmte Oberfläche

Als drittes zweidimensionales Strömungsbeispiel werden die inkompressiblen Navier-Stokes-Gleichungen dahingehend verändert, dass eine Konfiguration entsteht, welche als Übergangzur Widerstandsreduktion in 7.2 verstanden werden kann. An dieser werden die beiden nochverbleibenden Methoden – die Modellinterpolation durch Ausrichten sowie die adaptive Mo-dellreduktion – getestet. Betrachtet wird ein Längsschnitt durch eine flache Platte oder einenFlügel, auf den transversale Oberflächen aufgeprägt werden. Die Motivation dieses Konzeptes,das links in Abbildung 7.12 bildlich dargestellt ist, und der Zusammenhang mit der Wider-standsreduktion wird im folgenden Kapitel 7.2 ausgeführt. Die Oberflächenwellen können inihrer Frequenz ω und ihrer Amplitude A verändert werden, wobei hier nur der Fall einer va-riablen Amplitude betrachtet wird. Für den Längsschnitt durch die Platte ergibt sich bei einerVernachlässigung der Gitterbewegung durch die Oberflächenbewegung das in Abbildung 7.12rechts gezeigte vereinfachte System, dass hier als Beispielsystem dient.

Anström-bedingung

Oberflächenwelle

Längs-schnitt z

A tω ωsin( )

x1

x2

Abbildung 7.12: Längsschnitt durch eine durch Oberflächenwellen veränderte Platte und verein-fachtes Ersatzsystem.

Die Gleichungen, die das System beschreiben, sind erneut die Navier-Stokes-Gleichungen in(2.8) mit im Gegensatz zu den vorherigen Beispielen geänderten Randbedingungen. Wäh-rend an der linken Seite mit vx1(x1 = 0, x2) = z und unteren Seite mit vx2(x1,x2 =0) = Aω sin(ωt) Dirichlet-Randbedingungen vorgegeben werden, liegen rechts und am obe-ren Rand homogene Neumann-Randbedingungen vor. Da zwei inhomogene und unabhängigeRandbedingungen vorliegen, werden zwei homogenisierenden Basisfunktionen benötigt. DieSnapshot-Daten wurden so erstellt, dass ausgehend von der stationären Lösung für A = 0und z = 1 bei einer Viskosität von µ = 0, 01 die Amplitude in der Form 1− e−5t auf A = 1

112

Page 125: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

angehoben wurde. Die zeitvariablen Randbedingungen z und Aω sin(ωt) gehen aufgrund desFattorini-Tricks nur in ihrer Ableitung in das reduzierte Modell ein. Zur stabilen Integrationdes reduzierten Modells bezüglich der Stellgröße A des Reglers wird die tatsächliche Rand-bedingung am unteren Ende gemäß der Kettenregel über

vx2 = Aω sin(ωt)− Aω2 cos(ωt) (7.26)

realisiert, wobei A und A durch die Verwendung des PT1 über eine zusätzliche Gleichungim reduzierten Modell umgesetzt werden. Die Homogenisierungsmoden sind das initiale Strö-mungsfeld für z und ein Zeitpunkt für den sin(ωt) = 1 gilt für vx2 . Für die Frequenz giltω = 2

3π.

7.1.3.1 Adaptive Modellreduktion

Für dieses System wurde die Modelladaption wie in 4.3 beschrieben umgesetzt. Bei N = 9POD Basisfunktionen ergab sich ein RIC von 98.92 % für die Snapshot-Daten. Als Validierungwurde der RIC durch Projektion der Basisfunktionen auf Validierungsdaten, für welche dieViskosität auf µ = 1

150 gesenkt wurde, berechnet. Hierbei ergab sich ein RIC von 90, 96%.Das Modell ist durch den stark abfallenden RIC offensichtlich sensitiv bezüglich µ, was dieAdaption des Modells über die fiktiven Viskositäten begünstigt, aber ebenso die Verwendungvon Closure Models notwendig macht. In Abbildung 7.13 sind die durch das Kalmanfiltergeschätzten Zustände und die projizierten Zustände des reduzierten Modells einmal mit (jointKalmanfilter, rechts) und einmal ohne (normales Kalmanfilter, links) Adaption dargestellt. DieVerläufe der geschätzte Parameter für µe und p der Adaption sind in Abbildung 7.14 gezeigt.Die Simulation zeigt dabei die Validierungsdaten, wobei das korrekte µ = 1

150 im reduziertenModell verwendet wurde. Die Messgrößen des Filters sind zwei Geschwindigkeitsmessungen:Eine nahe des Einlasses zum Bestimmen von z und eine in der Mitte des Rechengebietes.Beide Filter waren – abgesehen von den erweiterten Zuständen und deren Parametrierung– mit identischen Einstellparametern versehen. Die Rechenzeiten beider Filter unterschiedensich minimal: Im Mittel war der Filter ohne Adaption um 1, 2 % schneller. Das linearisierteSystem war für eine Amplitude A 6= 0, was für t 6= 0 gegeben war, in den Simulationen stetsbeobachtbar.

Der Beobachter ohne Adaption ist in der Lage, eine gute Schätzung der Zustände zu liefern.Dennoch gibt es offensichtlich einen nicht verschwindenden Fehler zwischen geschätztem undprojiziertem Zustand für Mode 1 und 2. Dieser Fehler verschwindet für die adaptive Modellre-duktion. Um dies zu erreichen, nimmt der Beobachter durch das Ändern des Rempfermodellsweg von seinem Initialwert eines quadratischen Modells hin zu einem Wurzel-Modell einekurzfristige Verschlechterung der Schätzung in Kauf. Diese Änderung ist bei ungefähr 7 secdeutlich zu sehen. Am Ende führt die Adaption – auch wenn es während des Adaptionsprozes-ses zu einer größeren Abweichung kommt – zu einer exakteren Schätzung der Modellzustände.Die Adaption des reduzierten Modells war in diesem Sinne erfolgreich. Es bleibt jedoch auchfestzuhalten, dass die während der Adaption die Schätzung schlechter wird. Daher sollte die

113

Page 126: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

5 10 15 20 250Zeit in Sekunden

Mode 1Mode 2Mode 3

projiziertgeschätzt

5 10 15 20 250

0

1a

2

-1Zeit in Sekunden

Ohne Adaption Mit Adaption

Abbildung 7.13: Projizierte und geschätzte Zustände des reduzierten Modells mit und ohne Adap-tion

5 10 15 20 250Zeit in Sekunden

5 10 15 20 250Zeit in Sekunden

0

0,025

µe

0,4

2

p

-0,011

Abbildung 7.14: Verläufe der geschätzten fiktiven Viskosität µe und des Rempfer-Parameters p

Adaption nur für langsame Änderungen und Anpassungen verwendet werden, damit diese Ef-fekte weniger stark zum Tragen kommen. Auch sollte noch bemerkt werden, dass für falscheParametrierungen der Matrizen Q

KFund RKF des Kalmanfilters keine guten Ergebnisse

erzielt werden. Für eine zu starke Bestrafung von µe und p kommt es zu keiner Adaption,während eine zu schwache Einstellung sogar zu Instabilitäten in der Schätzung führen kann.

7.1.3.2 Modellinterpolation

Neben der Modelladaption wurden an der einfachen überströmten Platte die Verfahren derModellinterpolation untersucht. Im Gegensatz zu den Untersuchungen an der doppelten Ni-schenströmungen, wo die Verbesserung der Modelle und das Weitertragen dieser Verbesse-rung in einer Regelung im Vordergrund standen, liegt hier der Fokus auf einem Vergleichder diversen vorgestellten Verfahren. Neben der Berechnung der Geodäten und der Bézier-Kurven wurden das Ausrichten in der generalisierten Struktur mit den beiden Funktionenf(t) = sin(0.5πt) und f(t) = t durchgeführt. Hierzu wurden insgesamt 128 verschiedene Si-mulationen durchgeführt, in denen kombinatorisch verschiedene Aktuierungen für die Ampli-tude A(t), die Anströmung z und Viskositäten durchgeführt wurden. Dabei war die Viskositätder Interpolationsparameter, während die beiden anderen Parameter andere Snapshot-Datendefinierten und somit eine variable Grundlage für die Modellreduktion darstellten. Die Ände-rungen von A und z wurden vorgenommen, um eine allgemeingültigere Aussage bezüglich derPerformanz der Methoden zu finden und nicht ein zufälliges Ergebnis für einen bestimmten

114

Page 127: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.1 Mathematische 2D-Strömungsmodelle

Satz von Snapshot-Daten zu erhalten. Die 128 Simulationen werden im Folgenden in dreiSzenarien unterteilt. Das erste Szenario hat dabei zum Ziel, den Effekt der stetigen Diffe-renzierbarkeit der Bézier-Kurven zu untersuchen. Dieser sollte vor allem in der Nähe des zuinterpolierenden Punktes zu beobachten sein, weshalb in diesem Szenario die Unterscheidunggetroffen wird, ob der zu interpolierende Punkt nah oder nicht nah an einer Stützstelle liegt.Das zweite Szenario untersucht, ob es einen Unterschied macht, ob eine Bézier-Kurve vomGrad 2 oder 3 verwendet wird. Die Kurven von Grad 2 treten im ersten und letzten Interpolati-onsstück auf. Als letztes Szenario wird unterschieden, ob die Interpolation im Bereich höhereroder niedrigerer Viskositäten durchgeführt wird. Hier ist zu erwarten, dass die Interpolationfür geringere Viskositäten einen größeren Vorteil gegenüber dem Verwenden des nächstge-legenen Modells bietet als für höherer Viskositäten, da mit einem Sinken der Viskosität dieNichtlinearität des Navier-Stokes-Gleichungen steigt und die Robustheit der reduzierten Mo-delle entsprechend sinkt. In allen Simulationen wurden dabei Punkte, die sich exakt in derMitte zwischen zwei Stützstellen befinden, vermieden, da dort wegen

sin(0.25π)cos(0.25π) = 0.5

0.5 = 1 (7.27)

gilt und daher zwischen den beiden unterschiedlichen Funktionen des Ausrichtens nicht diffe-renziert werden kann. Als Fehlermaß wird der Projektionsfehler eproj verwendet. Die Skalie-rung des Fehler wird dabei abweichend so vorgenommen, dass 0 % für eproj und damit eineperfekte Rekonstruktion der PDE steht (die nicht erwartet werden kann), während 100 % derFehler des Modells ist, welches zum am nächsten befindlichen Stützpunkt gehört. Ein Wertvon über 100 % bedeutet daher, dass die Interpolation das Modell im Vergleich zum simplenBeibehalten des nächstgelegenen Modells verschlechtert. Die in den folgenden Tabellen ange-gebene Werte sind die Mittelwerte all derjenigen der 128 Simulationen, welche die genanntenSzenarien erfüllen, wobei die Repräsentanten der anderen Szenarien balanciert wurden, dasheißt, dass beispielsweise für die Unterscheidung zwischen niedrigen oder hoher Viskositätgleich viele Bézier-Kurven von Grad 2 wie von Grad 3 verwendet wurden. Daher sind dieErgebnisse aller drei Szenarien statistisch voneinander unabhängig.

Mittelwert Geodäte Bézier f(t) = sin(t) f(t) = tnah 99,51% 100,7% 99,26% 99,40%

nicht nah 80,21% 81,89% 79,86% 80,09%Grad 2 89,74% 83,23% 85,57% 85,80%Grad 3 87,22% 92,14% 86,20% 86,19%µ höher 93,37% 95,02% 93,26% 93,07%µ niedriger 81,55% 82,48% 81,22% 81,44%

Als erstes ist zu erkennen, dass die Modellinterpolation in nahezu jeder Konfiguration eineVerbesserung des Modells bietet. Einzige Ausnahme ist die Bézier-Kurve für nahe Punkte.Dies widerlegt die Annahme und Motivation, dass eine stetig differenzierbare Interpolationnotwendig oder gewünscht sei, da die Bézier-Kurve als einzige in den Stützpunkten stetigdifferenzierbare Funktion schlechtere Resultate als gar keine Interpolation liefert. Dennoch

115

Page 128: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

wird in allen anderen Fällen der Modellfehler teilweise massiv reduziert. Der Effekt ist umsogrößer, je weiter die Arbeitspunkte von der Stützpunkten entfernt sind, da dort der Modell-fehler ohne Interpolation stark ansteigt. Die Verbesserung wird zudem größer je kleiner dieViskosität und je größer damit die Nichtlinearität ist. Das Szenario bezüglich des Grades derBézier-Kurve überrascht durch sein Ergebnis, weil die Bézier-Kurven vom Grad 2 die bestenErgebnisse liefern, während der Kurven vom Grad 3 am schlechtesten überhaupt abschneiden.Die Ergebnisse können dahingehend gedeutet werden, dass die stetige Differenzierbarkeit, diedie Verwendung der Kurven vom Grad 3 nötig macht, aufgrund der rauen und nicht glattenStruktur der Graßmann-Mannigfaltigkeit nicht benötigt wird und das Ergebnis verschlechtert.Es könnte daher für die Zukunft interessant sein, eine Interpolation durch das aneinanderrei-hen von Bézier-Kurven vom Grad 2 durchzuführen.

Vergleicht man die Methoden gesamthaft untereinander, scheint es so, als würde die f(t) =sin(t) insgesamt am besten abschneiden. Zur näheren Betrachtung wurden dazu die Stan-dardabweichung berechnet und ein Ranking erstellt, welche Methode für jeden der 128 Fälledas beste Ergebnis liefert.

Geodäte Bézier f(t) = sin(t) f(t) = tStandardabweichung 1,74% 5,87% 3,51% 3,57%

1. Platz 20 39 39 302. Platz 10 0 74 443. Platz 69 0 6 534. Platz 29 89 9 1

Die Bézier-Kurven liefern entweder das beste oder das schlechteste Ergebnis, was auch diehohe Standardabweichung bewirkt. Ansonsten schneidet die sin(t)-Methode am besten ab.Die Geodäten haben hingegen die geringste Standardabweichung und können daher als ro-buster und verlässlicher als die anderen Methoden angesehen werden.

Die durchschnittlichen Rechenzeit sind in der nachfolgenden Tabelle aufgeführt:

Geodäte Bézier f(t) = sin(t) f(t) = tRechenzeit 12,39ms 20,48ms 10,81ms 10,14ms

Offensichtlich sind die Methoden, die auf der Graßmann-Mannigfaltigkeit operieren langsa-men als die Methoden, die das Ausrichten verwenden. Die Bézier-Kurven verbrauchen mehrRechenzeit als die Geodäten, da im Gegensatz zu den Geodäten eine zusätzliche Singulär-wertzerlegung berechnet werden muss, da diese nicht offline vorberechnet werden kann. Diezugehörige Rechenzeit und Wertung wurde von Autor in [82] noch anders angegeben, dadort die Auslagerung der Singulärwertzerlegung nicht berücksichtigt wurde. Nimmt man dieSingulärwertzerlegung für die Geodäte ebenfalls in der Online-Phase vor, so erhöht sich dieRechenzeit auf 19, 34ms.

116

Page 129: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.2 Widerstandsreduktion an einer überströmten Platte

Abschließend kann festgehalten werden, dass alle Methoden mit Ausnahme der Bézier-Kurvenvom Grad 3 exzellente Ergebnisse liefern und das Modell stets verbessern können. Aufgrund derstatistischen Analyse ist die Verwendung der Modellinterpolation besonders dann empfohlen,wenn die Viskosität niedrig ist oder nur wenige Stützstellen vorberechnet werden können, dadort der Fehler ohne Interpolation signifikant höher ist.

7.2 Widerstandsreduktion an einer überströmten Platte

Nach den eher mathematisch motivierten Beispielen aus 7.1 soll nun das erste von zwei an-wendungsnahen Problemen untersucht werden: Der Strömungswiderstand von Fahrzeugen,Flugzeugen oder Schiffen spielt beim Treibstoffverbrauch dieser Transportsysteme eine tra-gende Rolle. Der Widerstand, das ist die Kraft die ein Körper seiner Bewegung entgegensetzt,setzt sich dabei hauptsächlich aus dem Druckwiderstand, der sich aus der Druckdifferenz zwi-schen Vor- und Rückseite des Objektes ergibt, und dem Schubspannungswiderstand, der auchReibungswiderstand genannt wird, zusammen. Zweiterer ergibt sich aufgrund der Reibungdes an der Oberfläche des Objektes anhaftenden Fluids und ist stark von der Oberflächen-struktur und davon abhängig, ob die Strömung laminar oder turbulent ist. Daher wurden inder Aerodynamik diverse Ansätze untersucht, um die wandnahen turbulenten Strukturen derStrömung gezielt zu beeinflussen, um so die turbulente Grenzschicht, die massiv zum Wider-stand beiträgt, in ihrer Ausbildung zu stören. Dadurch könnten immense Energieeinsparungenim Transportsektor erreicht werden. Zur Beeinflussung der turbulenten Strukturen wurdenzahlreiche Aktorkonzepte vorgestellt, die wahlweise in experimentellen oder simulativen Un-tersuchungen bezüglich ihrer Sinnhaftigkeit auf die Probe gestellt wurden. Neben rotierendenScheiben [94] oder Bewegungen innerhalb der Ebene der überströmten Oberfläche [115] wur-den hier insbesondere auch transversale Oberflächenwellen [59, 74, 114] ins Visier genommen.Um diese Aktoren sinnvoll zur Widerstandsreduktion verwenden zu können, müssen sie in eineRegelungsstrategie eingebettet werden, da der Widerstand ebenso von den Anströmbedingun-gen beeinflusst wird. Für die Regelung wiederum werden Modelle benötigt, welche, da es sichbei überströmten Oberfläche im Strömungen handelt, über Modellreduktionsverfahren ausPDEs gewonnen werden können. Im Folgenden soll auf der Basis hochaufgelöster Strömungs-simulationen ein dynamisches reduziertes Modell für die Widerstandsreduktion einer durchOberflächenwellen aktuierten Platte, bei der sich die Amplitude der Welle ändert, gewonnenwerden. Die Fragestellung und die Simulationsdaten stammen dabei aus der ForschergruppeFOR1779 ’Aktive Widerstandsreduktion durch wellenförmige Oberflächenoszillation’. In Abbil-dung 7.15 ist dazu das Rechengebiet der CFD-Simulation einer turbulenten, dreidimensionaleGrenzschicht einer Platte mit transversalen Oberflächenwellen gezeigt.

Die drei Koordinatenrichtungen x1, x2 und x3 werden wie alle Größen in normierten Einheitenx+ angegeben, was bedeutet, dass diese auf die Reibungsgeschwindigkeit am Einlass vτ ,inlet

1und die kinematische Viskosität µ bezogen werden. Die Dimensionen l1, l2 und l3 werden dannentsprechend in Vielfachen der Impulsverlustdicke ϑinlet am Einlass (das heißt x+

1 = xinlet1 )

angegeben. Dabei gilt l1 = 230ϑinlet, l2 = 80ϑinlet sowie l3 = 11, 8ϑinlet. Die Wellenlänge λder Oberflächenwelle wurde mit λ = 0, 5l3 so gewählt, dass zwei Perioden im Rechengebiet

117

Page 130: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

l3

synthetisches, turbulentes Grenzschicht-Profil

Übergangsgebiet

Abströmung

Anströmung

Periodizität

Abströmung

Wand (Welle)

Wand (Ebene)x1=0

x1inlet

l1

l2

Abbildung 7.15: Skizze des Rechengebietes der turbulenten Grenzschicht der aktuierten Platte

dargestellt werden. Das Rechengebiet ist weiter in x1-Richtung in drei Abschnitte unterteilt:Im ersten von xinlet

1 = −50ϑinlet ≤ x1 ≤ 0 ist die Platte nicht aktuiert und damit flach,während der 3ϑinlet-lange zweite Abschnitt als Übergang hin zum dritten Abschnitt dient, inwelchem die Aktuierung voll ausgeprägt ist. Der Übergang von der flachen Oberfläche hin zurbewegten erfolgt über die Funktion

xwand2 (x1) =

0 , für x1 ≤ 0A2

[1− cos

(πx1

3ϑinlet

)], für 0 ≤ x1 ≤ 3ϑinlet

A , für x1 ≥ 3ϑinlet.

Die sich in x3-Richtung bewegenden Oberflächenwelle ist durch

x+2

∣∣∣wand

(x+3 , t+) = A+ cos

(2πλ+x

+3 − 2πω+t+

), (7.28)

gegeben. Damit wird die Wand am unteren Ende des Rechengebietes in x2-Richtung ausge-lenkt. Welle und Übergangsfunktion sind zur Visualisierung in Abbildung 7.16 dargestellt.

Während der Simulation zur Erstellung der CFD-Daten (und damit auch der Snapshot-Daten)wurden außer der variablen Amplitude A+ alle anderen Parameter konstant gehalten, was kon-kret bedeutet, dass für Wellenlänge λ+ = 500, für die Frequenz ω+ = 1

80 , für die auf dieImpulsverlustdicke bezogenen Reynoldszahl Reϑ = 2000 und Ma = 0, 2 für die Machzahlgewählt wurde. Die Auflösung des Gitters entspricht nahe der Wand einer DNS-Auflösungvon x+

2 = 1, das heißt, dass alle turbulenten Strukturen exakt aufgelöst werden. Weiter

118

Page 131: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.2 Widerstandsreduktion an einer überströmten Platte

-101

-1 0 1 2 3 4

Form der Welle

x /1 ϑinlet

-1 5,0

1 5,

0 0 2, 0 4, 0 6, 0 8, 1

x2

+/A+

x /3 λ

x2

+/A+

Übergang zur Welle

Abbildung 7.16: Form des Übergangs hin zur aktuierten Platte und Form der Oberflächenwelle

von der Wand entfernt findet durch eine nicht äquidistante Verteilung der Gitterpunkte derÜbergang zur einer gröberen Auflösung statt. Insgesamt erfüllt die Gitterauflösung die gän-gigen Kriterien für die Anwendung für Large Eddy Simulation (LES)-Löser. Für die Auflö-sung in x1- und x3-Richtung gilt ∆x+

1 = 12 und ∆x+3 = 4. Das gesamte Gitter hat damit

1500×142×286 ≈ 6, 1 107 Gitterpunkte. Der numerische Löser, welcher die dreidimensiona-len Navier-Stokes-Gleichungen über ein finite Volumen Verfahren löst, ist in [69] beschrieben.Weitere Details finden sich auch in [89].

Die immense Anzahl an Gitterpunkten macht klar, dass eine Analyse des Systems zu sys-temtheoretischen Zwecken oder ein Reglerentwurf nur in Kombination mit einer Modellre-duktion sinnvoll durchgeführt werden kann. Zudem erfordert die simulative Lösung enormeRechenzeiten, weshalb nur eine eingeschränkte Menge an Daten zur Verfügung steht. Imvorliegenden Fall konnte in der Simulation genau ein Zeitverlauf aufgenommen werden, beiwelchem sich die Amplitude von A+ = 10 nach A+ = 30 gemäß der Funktion

A+(t) = 10 + 20 (1− e−2(t−t0)) (7.29)

mit t > t0 änderte. Die Größenordnung von A+ ist dabei von den Arbeiten in [59] inspiriert.Aufgrund der Tatsache, dass nur ein Zeitverlauf vorliegt, wurden die Daten auf Basis derOrtskoordinate in Snapshot- und Validierungsdaten eingeteilt. Dabei wurden der Abschnitt100ϑinlet ≤ x1 ≤ 150ϑinlet als Snapshots verwendet und der Bereich 150ϑinlet ≤ x1 ≤ 200ϑinletzur Validierung. Die Homogenisierung erfolgte analog zur einfachen überströmten Platte in7.2, wobei zusätzlich mit der Idee des centering trajectory approach das mittlere Strömungs-feld herausgerechnet wurde. Zusätzlich muss beachtet werden, dass sich im Falle der Oberflä-chenwelle das numerische Gitter mit der Oberflächenwelle mitbewegt. Die konkrete Bewegungdes numerischen Gitters ist bekannt, da die Bewegung der Welle zu jedem Zeitpunkt bekanntist. Die Galerkin-Projektion bezieht sich auf die Formulierung der PDE auf dem physikali-schen Gitter, die POD jedoch basiert auf den Snapshot-Daten und damit auf dem bewegtennumerischen Gitter. Aufgrund der bekannten Transformation zwischen dem physikalischenund dem numerischen Gitter führt dies jedoch nicht zu Problemen, da die berechneten Ba-sisfunktionen in das physikalische Gitter transformiert werden können, wo sie dann mittelsGalerkin-Projektion zur Bildung des reduzierten Modells dienen. Allerdings entsteht durchdas bewegte Gitter eine weitere Schwierigkeit bei der Berechnung des Widerstandes über dasreduzierte Modell: Für den Widerstand cD gilt mit der Oberfläche (nicht der Amplitude!) A

119

Page 132: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

cD =µ∫x1

∫x3∇v|x2=0 · n dx1dx3

ρ2 (v∞1 )2A

, (7.30)

weshalb der auf der Oberfläche senkrecht stehende Normalenvektor benötigt wird, um denWiderstand korrekt zu ermitteln. Setzt man den Separationsansatz der Modellreduktion fürden Widerstand an, so erhält man durch die bewegte Oberfläche einen zeitveränderlichen Nor-malenvektor. Damit lässt sich der Ausdruck aber nicht in rein ortsabhängige Teile, die sichoffline durch Lösen des Integrals zu einer Ausgangsmatrix C berechnen lassen würden, auftei-len. Es resultiert damit eine zeitvariante Ausgangsmatrix C(t) im reduzierten Modell. DieserEffekt ist aber vergleichsweise klein, da der Normalenvektor stets fast nur in x2-Richtung deu-tet und die Komponenten in x3-Richtung sich durch den Sinus im Mittel nahezu aufheben.Im reduzierten Modell wird daher so getan, als ob der Normalenvektor nur in x2-Richtungdeuten würde.

Bei einer Verwendung der POD auf die Strömungsdaten ergab sich der relative Informations-gehalt in Abbildung 7.17.

0

0 1,

0 2,

0 3,

0 4,

0 5,

0 6,

0 7,

0 8,

0 9,

1

RIC

5 10 15 20 25 30 35 40 45 50 55 60Anzahl der verwendeten Basisfunktionen N

Abbildung 7.17: Relativer Informationsgehalt der turbulenten Grenzschicht

Die massiv angestiegene Schwierigkeit einer gute Modellreduktion ist am RIC sofort erkennbar.Die erste Basisfunktion umfasst – im Gegensatz zu den vorherigen Modellreduktionen in dieserArbeit– nur etwa 15 % der in den Strömungsdaten beinhalteten Informationen im Sinne des

120

Page 133: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.2 Widerstandsreduktion an einer überströmten Platte

RIC. Selbst für die hohe Anzahl an Basisfunktionen vonN = 60 werden gerade einmal 90 % imRIC erreicht. Es ist also nicht zu erwarten, dass die POD mit einer akzeptablen Modenanzahlim reduzierten Modell das Strömungsfeld akkurat abbilden kann. Es besteht dennoch dieMöglichkeit, dass die Abbildung des gemäß (7.30) definierten Widerstandes cD, der nur diekorrekten Geschwindigkeiten in Wandnähe benötigt, über die projizierten Basisfunktionensich darstellen lassen könnte. Für die simulierten Koeffizienten ist dies weniger zu erhoffen,da für das korrekte Abbilden der dynamischen Zusammenhänge das gesamte Strömungsfeldannähernd korrekt wiedergegeben sein müsste. Berechnet man für die Validierungsdaten dieVerläufe für cD aus den Simulationsdaten und vergleicht diese mit den Widerstand, der sichaus der Projektion mit N = 30 ergibt, so erhält man das Resultat in Abbildung 7.18. DieZeit ist hier in konvektiven Zeiteinheiten tkonv = t · ϑinlet

v∞1angegeben.

200 400 600 800 1000 12000

CFD-SimulationPOD projiziert

tkonv

cD

4,6

4,8

5,0

5,2

5,4

5,6

5,8

6,0

6,2

6,4

Abbildung 7.18: Vergleich des Widerstandes der CFD-Simulation mit den projizierten Koeffizientender POD mit N = 30 Basisfunktionen

Offensichtlich kann selbst der auf Basis der projizierten Koeffizienten berechnete Widerstandden tatsächlichen Widerstand nicht in sinnvoller Weise annähern. Der von der POD ermittelteWiderstand beinhaltet dabei dynamische Effekte und Frequenzen, die im eigentlichen Wider-stand nicht erkennbar sind. Dieses Versagen der POD liegt nicht an der Galerkin-Projektion,da hier nicht die ODE eines reduzierten Modells integriert wird. Stattdessen wird durch dasVerwenden der Projektion ein perfektes Wissen der zugrunde liegenden ODE angenommen.Daher zeigt die große Abweichung zwischen den beiden Verläufen, dass die POD nicht geeig-net ist, eine Modellreduktion für die turbulente Grenzschicht vorzunehmen.

Das Versagen der POD kann möglicherweise damit identifiziert werden, dass die POD mit denglobalen Maßen des Skalarprodukts und des quadratischen Fehlers nicht in der Lage ist, sichauf entscheidende lokale Informationen zu fokussieren. Sowohl im Skalarprodukt als auch imFehlermaß der POD wird gleich gewichtet, ob der betrachtete Strömungsvektor nah oder fern

121

Page 134: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

der aktuierten Oberfläche angesiedelt ist. Das Einbeziehen sämtlicher Ortspunkte ist dabeieinerseits notwendig, um ein adäquates Abbild der Dynamik der Navier-Stokes-Gleichungenzu liefern, andererseits hilft dies wenig, wenn dabei die Wiedergabe des Widerstandes zusehr vernachlässigt wird wie in 7.18 zu beobachten war. Daher sollen als Gegenentwurf dieLaplacian Eigenmaps als auf lokale Informationen fokussierte Methode untersucht werden. DieSpeicherung der lokalen Informationen erfolgt in den Laplacian Eigenmaps durch da Aufstellender Nachbarschaftsbeziehungen, wobei ε beziehungsweise k, δ und die verwendete Metrik ddie Einstellparameter sind. Die Standardwahl der Metrik d1 wäre analog zum Skalarproduktder POD

d1 (vi,vj) = 〈vi − vj,vi − vj〉L2. (7.31)

Auch hier würden wieder Punkte nahe oder entfernt der Oberflächenwelle gleicht gewichtet.Lässt man sich von der Diskretisierung in x2-Richtung inspirieren, so wird dort typischerweiseeine exponentielle Verteilung der Gitterpunkte vorgenommen, um die wandnahen Strukturenbestmöglich aufzulösen. Die Verwendung der maßgeschneiderten Metrik d2 als

d2 (vi,vj) = 〈e−x+2 (vi − vj), e−x

+2 (vi − vj)〉L2 (7.32)

stellt die konsequente Abbildung dieser Überlegung als Metrik dar. Im Gegensatz zu den Arbei-ten in [45], wo für einen vergleichbaren Datensatz eine zeitliche Filterung des Strömungsfeldesvorgenommen wurde, stellt dieser Ansatz eine örtliche Filterung dar. Die Funktion d2 ist dabeiauch tatsächlich eine Metrik, da d2 offensichtlich symmetrisch ist und die Dreiecksungleichunggilt und auch positiv ist, da e−x

+2 6= 0 ∀x+

2 ist. Für die Laplacian Eigenmaps wurden über d2die Abstände aller Snapshots untereinander berechnet und als Matrix gespeichert. Der Re-chenaufwand hierfür ist vergleichbar mit dem Berechnen der Korrelationsmatrix der POD. DieParameter δ und ε wurden nicht aufwendig optimiert, sondern der beste von drei Versuchenverwendet. Da durch den ortsfilternden Ansatz vermutlich dynamisch wichtige Teile herausge-filtert worden sind, wurde analog zu [45] der lineare Term L des Galerkin-Modells identifiziertwährend der nichtlineare über die Galerkin-Projektion errechnet wurde. Da L stets mit derViskosität µ multipliziert wird entspricht dieses Vorgehen dem der Closure Models [80]. ZurIdentifikation wurden die projizierten Koeffizienten gemäß der Methodik in [26] verwendet.Die Identifikation wurde dabei für die Snapshot- und nicht für die Validierungsdaten erstellt.Als Resultat ergaben sich für die projizierten und simulierten Koeffizienten die Widerstands-verläufe in Abbildung 7.19. Es wurden dabei N = 20 Moden statt N = 30 wie bei der PODverwendet.

Im Gegensatz zur POD sind die Laplacian Eigenmaps in der Lage, die wesentliche Dynamikdes Widerstandes zu erfassen. Die Höhe des Ausschlags nach Beginn der Amplitudenänderungist ebenso wie die Frequenzen nach dem Ausschlag gut getroffen. Lediglich die Zeitkonstantedes Abklingens nach dem Ausschlag wird nicht genau wiedergegeben. Diese Resultate geltensowohl für die simulierten als auch die projizierten Koeffizienten, wobei festzustellen ist, dasdie höherfrequenten Anteile in den simulierten Verläufen fehlen. Das resultierende reduzierte

122

Page 135: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.3 Wärmekonvektion in einem Festbettspeicher

200 400 600 800 1000 12000

cD

CFD-Simulation

LEM simuliertLEM projiziert

tkonv

4,6

4,8

5,0

5,2

5,4

5,6

5.,

6,0

6,2

6,4

Abbildung 7.19: Vergleich des Widerstandes der CFD-Simulation mit den projizierten und simu-lierten Koeffizienten der Laplacian Eigenmaps mit N = 20 Basisfunktionen

Modell ist zu dem lokal stabil, was durch die Analyse der Eigenwerte der Linearisierung über-prüft wurde. Diese hatten – bis auf einen Eigenwert bei λ = 0 der vom stationären gemitteltenStrömungsfeld herrührt – alle negativen Realteil.

Zusammenfassend kann festgehalten werden, dass die Laplacian Eigenmaps als nichtlinea-re Modellreduktionsmethode einen klaren und enormen Vorteil gegenüber der POD in demschwierigen Szenario der Modellreduktion von turbulenten Grenzschichten darstellt. Dabeikonnte insbesondere die Flexibilität der graphenbasierten Verfahren bei der Wahl einer pas-senden und problemspezifischen Metrik ausgenutzt werden, um einen massiven Gewinn anWiedergabegenauigkeit für die reduzierten Modelle zu erzielen.

7.3 Wärmekonvektion in einem Festbettspeicher

7.3.1 Regelungsaufgabe

Als letztes Beispiel wird im Folgenden ein technisches System, das nichts direkt mit denNavier-Stokes-Gleichungen zu tun hat, untersucht. Hierdurch soll die breite Anwendbarkeitder Methoden dieser Arbeit auf eine Vielzahl unterschiedlicher Strömungsprozesse untermau-ert werden. Betrachtet wird dabei der keramische Festbettspeicher eines Solarturmkraftwer-kes. Festbettspeicher werden in Solarturmkraftwerken aktuell dazu eingesetzt, überschüssigeHeißluft einzuspeichern, die bei der Energieerzeugung entsteht und ansonsten verloren wäre.Der Hintergrund hiervon ist, dass aktuelle Betriebsstrategien es priorisieren, das Kraftwerk

123

Page 136: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

am Designpunkt zu betreiben. Zur Veranschaulichung der Zusammenhänge ist dazu in Ab-bildung 7.20 das Schema des Solarturm Jülich gezeigt, der in dieser Arbeit wie auch schonin der Publikation des Autors in [89] als Anwendungsbeispiel dient. Wie in 7.20 gezeigt kannein Solarturmkraftwerk in die drei Teilsysteme Konzentratorsystem, Heißgaskreis und Wasser-dampfkreis unterteilt werden. Entscheidend für den Einsatz des Speichers ist der Fakt, dassdie innerhalb des Heißgaskreises durch den Receiver erzeugte Heißluft entweder direkt übereinen Wärmeübertrager in den Wasserdampfkreis übertragen oder im thermischen Speichergespeichert werden kann. Der aktuelle Betrieb am Designpunkt sieht hier vor, den Massen-strom in die Turbine konstant zu lassen und den überschüssigen Wärmestrom in den Speicherzu leiten. Für den Solarturm Jülich ist der Speicher ein keramisches Festbett wie schematischin Abbildung 7.21 gezeigt. Das Beladen des Speichers erfolgt dadurch, dass Heißluft vonoben nach unten langsam durch den Speicher geleitet wird. Beim Entladen wird umgekehrtder Speicher mit Warmluft von unten nach oben durchströmt. Aufgrund der niedrigen thermi-schen Leitfähigkeit der im Speicher verwendeten Keramik und der langsamen Durchströmungdes Speichers stellt sich dabei ein scharfes Temperaturprofil ein. Der Speicher ist in vier ge-trennte Kammern aufgeteilt, welche separat über Klappen angesteuert werden können. DerBeladungszustand des Speichers wird mithilfe von 24 Thermoelementen pro Speicherkammerüberwacht. Hierzu sind jeweils drei Thermoelemente in acht verschiedenen horizontalen Ebe-nen im Speicher angeordnet. Zusätzlich zu den Temperaturen werden auch die Massenströmein die vier Kammern und die Temperatur der Heißluft messtechnisch erfasst.

Abbildung 7.20: Schema des Solarturms Jülich

Die skizzierte Betriebsstrategie hat in Zeiten einer Einspeisevergütung für solarthermisch er-zeugte Energie ihre Relevanz. Im Falle einer vollständigen Martktteilnahme mit variablenStrompreisen kann es jedoch sinnvoller sein, zu Zeiten höherer Strompreise mehr Energiebereitzustellen [78]. Hierzu ist in Abbildung 7.22 der durchschnittliche Strompreis aus denJahren 2011 bis 2015 an der Leipziger Strombörse über die Tagesuhrzeit dargestellt. Einkonventionell betriebenes Solarturmkraftwerk ist nicht in der Lage, den hohen Spitzenpreisgegen 20 Uhr mitzunehmen, da die Einspeicherung und Entnahme der überschüssigen Heißluftden Strompreis nicht berücksichtigt. Der Speicher ermöglicht es dabei einem solarthermischenKraftwerk, das gezielte Speichern und Entnehmen von Heißluft im Rahmen einer überlagertenGewinnoptimierung zu nutzen.

124

Page 137: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.3 Wärmekonvektion in einem Festbettspeicher

8 Schichten

3 Thermoelementepro Schicht und Kammer

eingehendeMassenströme

ausgehendeMassenströme

Abbildung 7.21: Schematischer Aufbau des Festbettspeichers mit seinen vier Kammern

Ein möglicher Aufbau eines gewinnoptimierten Betriebs ist es, einen kaskadierten Regelkreiszu entwerfen, in welchem die gewinnoptimierende Strategie als äußere Regelschleife Solltem-peraturprofile an den Speicher vorgibt, die von diesem durch den Einsatz eines unterlager-ten Reglers realisiert werden. Der unterlagerte Regler fordert als Stellgröße einen Massen-strom an Heißluft an, während die verbleibende Heißluft über den Wasserdampfkreis geleitetwird. Aufgrund seiner Trägheit kommt dieser gut mit den dadurch hervorgerufenen Mas-senstromschwankungen zurecht. Eine Beschränkung des durch den Speicher anforderbarenMassenstroms kann dabei vernachlässigt werden, da am Designpunkt des Kraftwerks wenigerHeißluft in den Speicher als über den Wasserdampfkreis geleitet wird und daher im Arbeits-bereich des Speichers stets genug Massenstrom zur Verfügung steht. Das Ziel es ist dahermit einer Regelung das Erreichen gewünschter Temperaturprofile innerhalb eines thermischenFestbettspeichers durch geschickte Wahl des den Speicher durchströmenden Massenstromszu gewährleisten. Als Methoden soll dabei die vorgestellte optimale Regelungsstrategie inKombination mit den Laplacian Eigenmaps verwendet werden.

7.3.2 Beschreibung über partielle Differentialgleichungen

Für die Verwendung der anvisierten Regelungsstrategie werden ein PDE-Modell der Regel-strecke und die zugehörigen Optimalsteuerungsbedingungen benötigt. Über die Modellierungthermischer Festbettspeicher gibt es umfangreiche Literatur, wobei [55] als gute Gesamt-übersicht gilt. Da der Fokus dieser Arbeit nicht auf der konkreten Modellierung, sondern

125

Page 138: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

1Zeit in Stunden

Preis in[ /MWh]€

55

25 244 8 12 16 20

50

45

40

35

30

Abbildung 7.22: Durchschnittlicher Strompreis an der Leipziger Strombörse von 2011-2015

auf der Modellreduktion und der Regelung von Strömungsprozessen liegt, sei für die Detailsder Herleitung des PDE-Modells auf die Veröffentlichung des Autors in [89] verwiesen. DasPDE-Modell des Speichers lautet dabei

∂T

∂t= −uT ∂T

∂x+K1T (θ − T ) (7.33)

∂θ

∂t= (K2 −K3θ)(T − θ) (7.34)

mit den Randbedingungen∂θ

∂x(0, t) = ∂θ

∂x(1, t) = 0 (7.35)

und u ≥ 0 : T (0, t) = Tin(t) ∂T∂x

(1, t) = 0u < 0 : T (1, t) = Tin(t) ∂T

∂x(0, t) = 0

. (7.36)

Hier ist T die Temperatur der Luft, θ die Temperatur des Speichermediums und x ∈ [0, 1] dieHöhe des Speichers skaliert auf das Intervall [0, 1] mit x = 0 als oberem und x = 1 als un-terem Speicherende. Die drei Konstanten K1 bis K3 werden dabei an Messdaten identifiziertund das Modell an weiteren Messdaten validiert. Nachweise für die Gültigkeit des Modells fürden Solarturm Jülich finden sich ebenfalls in [89]. Die Stellgröße u stellt den Massenstrom anHeißluft in den Speicher dar. Je nach dem, ob der Speicher ent- oder beladen wird, verändernsich dabei die Randbedingungen am oberen oder unteren Ende zu Dirichlet-Randbedingungen.

Da die Streckenbeschreibung als PDE vorliegt, kann der Entwurf des Reglers über das Op-timalsteuerungsproblem für PDEs vorgenommen werden. Für das Gütefunktional gilt, da einProfil der Speichertemperatur θ eingestellt werden soll,

126

Page 139: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.3 Wärmekonvektion in einem Festbettspeicher

J(u, θ) = 12

tf∫0

2∫0

(θ − r)2 dx dt+ R

2

tf∫0

u2 dt. (7.37)

Weil es sich bei u bereits um einen Strom und damit um eine Ableitungsgröße handelt, wirdu statt u im Gütefunktional bestraft. Die Lagrangefunktion ist dann entsprechend

L (u, θ,T ,λ(x, t),κ(x, t)) = J(u, θ) +tf∫

0

1∫0

λ

(∂T

∂t+ uT

∂T

∂x−K1T (θ − T )

)+

tf∫0

1∫0

κ

(∂θ

∂t− (K2 −K3θ)(T − θ)

). (7.38)

Die Lagrange-Multiplikatoren λ und κ sind die zu T und θ adjungierten Temperaturen. DieAbleitungen nach λ und κ ergeben erneut die Modellgleichungen. Leitet man L nach T und θab und setzt die Ableitungen zu Null, so erhält man durch partielle Integration die adjungiertenGleichungen

∂λ

∂t= −κ(K2 −K3θ)− uT

∂λ

∂x+ λ(2K1T −K1θ) (7.39)

und

∂κ

∂t= (θ − r)− λK1T + κ(K2 +K3T − 2K3θ). (7.40)

Die Randbedingungen beider Gleichungen (7.39) und (7.40) sind homogen. Die Ableitungvon (7.38) nach der Stellgröße u liefert

u(t) = − 1R

1∫0

λT∂T

∂xdx (7.41)

und damit wie in den vorherigen Beispielen die gesuchte Berechnungsvorschrift des optimalenu(t). Dabei ist u von der Temperatur T sowie der adjungierten Temperatur λ abhängig, wobeizur Bestimmung von λ wiederum θ und κ benötigt werden. Auf die mathematischen Detailsder Herleitung wird verzichtet, da sich im Vergleich zu den bereits erfolgten Herleitungen keinzusätzlicher Erkenntnisgewinn ergibt.

127

Page 140: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

7.3.3 Modellreduktion

Für das Bilden der reduzierten Modelle sind die vorliegenden Messdaten nicht ausreichend,da diese nur acht Schichten innerhalb des Speichers abdecken. Die Verwendung von lediglichacht Punkten über dem Ort für die Snapshot-Daten stellt aber eine viel zu grobe Diskre-tisierung dar, für welche die Funktionstüchtigkeit der Modellreduktion äußerst fraglich ist.Für die adjungierten Gleichungen sind gar keine Messdaten vorhanden. Daher ist es notwen-dig, die Modellgleichungen simulativ zu lösen, um daraus Snapshot-Daten zu generieren. Dienumerische Lösung ist dabei insofern anspruchsvoll, als dass es sich um ein stark konvektions-dominantes Problem handelt, bei dem zusätzlich durch die Möglichkeit des Be- und Entla-dens die Richtung der Konvektion Wechseln unterworfen ist. Daher wurde eine modifiziertesUpwinding-Verfahren entworfen, welches abhängig von der vorliegenden Strömungsrichtung,die durch den gemessenen Massenstrom vorgegeben wird, die Stützstellen der Diskretisierungadaptiert.

Die Gleichungen für das Galerkin-Modell können wie üblich durch das Berechnen der Skalar-produkte und die Separationsansätze ermittelt werden. Aufgrund der zwei unterschiedlichenTemperaturen wird eine physikalisch motivierte Modellreduktion vorgenommen und zwei se-parate Modensätze für T und θ berechnet. Dies hat den Vorteil, dass die Struktur der PDEim reduzierten Modell erhalten bleibt. Eine Homogenisierung ist notwendig, um die Tempera-turen T und ϑ am unteren oder oberen Speicherende (je nach Beladung) zu homogenisieren.Für beide Temperaturen werden daher zwei Homogenisierungsmoden benötigt. Dabei wird dieHomogenisierungsmode für das obere Speicherende zu 900(1−x)2 gesetzt und die untere ausdem zeitlichen Mittel nach Homogenisierung des oberen Endes berechnet. Der Vorfaktor 900wurde dabei gewählt, um die Koeffizienten a(t) zu normieren und in derselben Größenordnungzu halten. Mit den Approximationen

T (x, t) =NT∑i=1

ai(t)ϕi(x) ; θ(x, t) =Nθ∑i=1

bi(t)ψi(x) (7.42)

errechnen sich für den Wärmespeicher die reduzierten Modelle zu

a = u(t)aequaae + aeqaaae + aeqabbe + ga[aNT+1aNT+2

](7.43)

aNT+1 = Toben

aNT+2 = Tunten

mit

quaijk = −〈ϕi(x)∂ϕj(x)∂x

,ϕk(x)〉L2

qaaijk = −K1〈ϕi(x) ·ϕj(x),ϕk(x)〉L2 (7.44)qabijk = K1〈ϕi(x) ·ψj(x),ϕk(x)〉L2

gaij = −〈ϕNT+j,ϕi〉L2

128

Page 141: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.3 Wärmekonvektion in einem Festbettspeicher

und

b = −K2b+Laae + beqbbbe + beqbaae + gb(K2

[bNθ+1bNθ+2

]+[bNθ+1bNθ+2

])(7.45)

aNT+1 = Toben

aNT+2 = Tunten

mit

Laij = K2〈ϕi(x),ψj(x)〉L2

qbbijk = K3〈ψi(x) ·ψj(x),ψk(x)〉L2 (7.46)qbaijk = −K3〈ϕi(x) ·ψj(x),ψk(x)〉L2

gbij = −〈ψNT+j,ψi〉L2

Das analoge Vorgehen zur Modellreduktion kann natürlich für die adjungierten Gleichungendurchgeführt werden, die nicht homogenisiert werden müssen. Mit den Separationsansätzen

λ(x, t) =Nλ∑i=1

ai(t)ϕi(x) ; κ(x, t) =Nκ∑i=1

bi(t)ψi(x) (7.47)

errechnet sich aus (7.39)

˙aj = −K2〈ψ, φ〉L2 b+K3b〈ψψ, φ〉L2 b− ua〈ϕ∂ϕ

∂x, ϕ〉L2 a+ (7.48)

2K1a〈ϕϕ, ϕ〉L2 a−K1b〈ψϕ,ϕ〉L2 a

und aus (7.40)

˙bj = 〈ψ, ψ〉L2 b− 〈r(x), ψ〉L2 +K3a〈ϕψ, ψ〉L2 b+ (7.49)K2b−K1b〈ϕϕ, ψ〉L2 a− 2K3b〈ψψ, ψ〉L2 b

sowie

u = − 1R

1∫0

ϕϕ∂ϕ

∂xdx

︸ ︷︷ ︸U

[a,a,a] (7.50)

mit dem dreistufigen Tensor U . Somit liegen alle für den Regler benötigten Gleichungen vorund es müssen nur noch die Basisfunktionen berechnet werden. Hierfür wurden die POD unddie Laplacian Eigenmaps verwendet. Die Snapshot-Daten wurden durch Simulation der PDEder Regelstrecke und des adjungierten Systems mit Massenströmen und Eingangstemperatu-ren aus den Messdaten gewonnen. Hierbei wurde darauf geachtet, dass die dafür ausgewähltenMesstage durch den Einsatz eines Gasbrenners eine hohe dynamische Anregung des Speicherszeigen. Des Weiteren wird zur Simulation der adjungierten Gleichung die Referenz r benö-tigt. Als Sollprofil wurde dabei ein technisch günstiges Temperaturprofil gewählt, welches inAbbildung 7.23 dargestellt ist.

129

Page 142: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

900

0x

T inKelvin

800

700

500

400

600

300

200 10,5 0,750,25

Abbildung 7.23: Gewünschtes Temperaturprofil des Wärmespeichers

Als Nachbarschaftsindikator der Laplacian Eigenmaps wird die ε-Methode verwendet und dieStandard L2-Metrik verwendet. Mit den üblichen Fehlermaßen für die projizierten Koeffizien-ten eprojsnap und eprojval , die so normiert sind, dass 100 % dem Fehler der Nulllösung entspricht,ergeben sich die in der Tabelle aufgeführten Ergebnisse. Die Anzahl der verwendeten Basis-funktionen wurde über den relativen Informationsgehalt der POD bestimmt. Es gilt abzüglichder Homogeniserungsmoden: NT = 4, Nθ = 4, Nλ = 3 und Nκ = 3.

POD LEMeprojsnap eprojval eprojsnap eprojval

T 0, 8349 % 2, 8169 % 1, 1570 % 1, 9449 %θ 0, 8569 % 2, 9180 % 1, 1047 % 2, 0448 %λ 0, 8725 % 2, 1344 % 1, 4855 % 1, 6022 %κ 1, 0251 % 2, 3098 % 1, 9228 % 1, 9544 %

Die POD erzielt für die Snapshot-Daten natürlich erneut die besten Ergebnisse. Doch auchdie Laplacian Eigenmaps schaffen es, dort zu einer guten Approximationen der Lösung zukommen. Für die Validierungsdaten liefern die Laplacian Eigenmaps die größere Genauigkeit,wobei der Vorteil gegenüber der POD in etwa dem Vorteil der POD für die Snapshot-Datenentspricht. Daher ist es von dem konkreten Anwendungsfall abhängig, welche der beiden Me-thoden zu bevorzugen ist. Kann der Betriebsbereich dergestalt eingegrenzt werden, dass eineunmittelbare Nähe zu den Snapshot-Daten sichergestellt werden kann, so ist die POD zu be-vorzugen. Ansonsten bieten die Laplacian Eigenmaps eine durchaus attraktive Alternative alsModellreduktionsverfahren, da sie die besseren Ergebnisse für die Validierungsdaten erzielen.In den folgenden Ergebnissen werden stets die Laplacian Eigenmaps verwendet.

Nach der Überprüfung der projizierten Koeffizienten erfolgt die Untersuchung der simulier-

130

Page 143: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.3 Wärmekonvektion in einem Festbettspeicher

ten Koeffizienten und damit des gesamten reduzierten Modells. Dabei ergeben sich für dieValidierungsdaten die in Abbildung 7.24 gezeigten Verläufe.

0 24Zeit in Stunden

12 186

050

100150

-50-100-150-200-250 0 24

Zeit in Stunden12 186

050

100150

-50

simuliertprojiziert

-100-150-200-250

0 24Zeit in Stunden

12 186

02

-2

a(t)~46

-4-6-8

-10

103

0 24Zeit in Stunden

12 186

01

b(t)

105

2345

-1-2-3

b(t)~

a(t) b(t)Mode 1Mode 2

Mode 3Mode 4

Abbildung 7.24: Simulierte und projizierte Verläufe des reduzierten Modells

Es ist gut erkennbar, dass für die Speichertemperatur θ und die Lufttemperatur T die Ver-läufe sehr gut aufeinanderliegen. Nur die Simulation des letzten Koeffizienten weicht vonseiner Projektion etwas stärker ab. Etwas anders fällt die Bewertung bei den adjungiertenTemperaturverläufen λ und κ aus. Trotz in etwa gleich guten Werte in den Gütemaßen fürdie projizierten Koeffizienten weiter oben, sind hier deutlichere Unterschiede zwischen Pro-jektion und Simulation erkennbar. Für dieses Phänomen sind diverse Gründe denkbar: Dadie Simulation der adjungierten Koeffizienten auf den Ergebnissen der Koeffizienten der Re-gelstrecke aufbaut, ist eine Fehlerfortpflanzung denkbar. Dies wurde überprüft, indem stattder simulierten a und b die projizierten Verläufe verwendet wurden, was das Ergebnis nichtmerklich beeinflusste. Das zeigt einerseits, dass das reduzierte Modell für a und b sehr gutfunktioniert, andererseits, dass hierin nicht die Fehlerquelle liegt. Andere Fehlermöglichkeitensind fehlende Anregung in den Snapshot-Daten oder eine starke Fehlerfortpflanzung durch dieNichtlinearität. Diese Fehler sind eher unwahrscheinlich, da bei dem Beispiel der doppeltenNischenströmung in 7.1 diese Effekte bei größerer Nichtlinearität nicht beobachtet werdenkonnten. Die beobachteten Abweichungen treten zudem auch bei den Snapshot-Daten auf,weshalb der Fehler nicht nur an deren möglicherweise nur eingeschränkten dynamischen Band-breite liegen kann.

131

Page 144: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

Eine andere Fehlerquelle sind Effekte der Referenztrajektorie, die nur die adjungierten Verläufebeeinflusst und in 7.1 anders umgesetzt wurde, da dort keine verteilte Trajektorie sondern nurein skalarer Wert eingeregelt wurde. Im Faktor 〈r(x), ψ〉L2 wird die Referenz auf die adjun-gierte Basisfunktion von κ projiziert. Auch wenn die Referenz selbst exakt übernommen undnicht durch Basisfunktionen approximiert wird, so werden nur die Teile von r(x) dynamischberücksichtigt, die durch die adjungierten Basisfunktionen dargestellt werden können. DasReferenzprofil wurde zwar so gewählt, dass es sich durch ψ gut darstellen lässt (also ein imZustandsraum für b erreichbares Regelziel darstellt). Dies muss aber nicht zwingend für ψgelten. Insbesondere sind die Randbedingungen von ψ homogen. Daher ist davon auszugehen,dass der Wert 〈r(x), ψ〉L2 voraussichtlich kleiner ist, als er von dynamischen Gesichtspunk-ten her eigentlich sein sollte. Dies könnte Abweichungen in b erklären, die auch die größtensind und welche sich dann über die gegenseitige dynamisch Kopplung auf a auswirken. Trotzder Abweichungen ist dennoch aus den Verläufen erkennbar, dass die wesentliche Dynamikund vor allem das Vorzeichen von λ und µ in den reduzierten Modellen erhalten bleibt. Daim Gesamtregelalgorithmus von der optimalen Stelltrajektorie u(t) nur die ersten Werte biszur erneuten Berechnung von u(t) im nächsten Regleraufruf ausgegeben werden, scheint vorallem die Tendenz der Prädiktion entscheidend. Gleicht man das reduzierte Modell final mitden Messdaten aus dem Solarturm Jülich ab, ergeben sich die Verläufe in Abbildung 7.25. DieMessschichten sind ihrer Höhe nach von links nach rechts und oben nach unten dargestellt,so dass sich die oberste Schicht (x = 0) links oben befindet. Es sind zwar Abweichungen beiinsbesondere den mittleren Schichten und schnellen Beladungswechseln erkennbar. Insgesamtstimmen die Verläufe relativ gut überein und die wesentliche Dynamik des Speichers wird vomreduzierten Modell gut abgebildet.

200 400 6000

100

200

300

400

500

600

700

200 400 6000

100

200

300

400

500

600

700

200 400 6000

100

200

300

400

500

600

700

200 400 6000

100

200

300

400

500

600

700

0 200 400 6000

100

200

300

400

500

600

700

0 200 400 6000

100

200

300

400

500

600

700

0 200 400 6000

100

200

300

400

500

600

700

0 200 400 6000

100

200

300

400

500

600

700

°[ C]°[ C] °[ C]

°[ C] °[ C]°[ C]°[ C]

°[ C]

0000

[min] [min] [min] [min]

[min] [min] [min] [min]

ModellMessdaten

Abbildung 7.25: Verlauf der Speichertemperatur im reduzierten Modell und den Messdaten

7.3.4 Ergebnisse der Regelung

Da eine Validierung der Ergebnisse am Solarturm selbst nicht möglich war, wird eine simulati-ve Erprobung des Reglers in einer Simulation mit dem PDE-Modell als Strecke vorgenommen.

132

Page 145: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7.3 Wärmekonvektion in einem Festbettspeicher

Dieses Modell wurde dabei zuvor an realem Messdaten validiert. Die drei an den Messdatenidentifizierten Parameter K1 bis K3 wurden für die Regelstrecke im Vergleich zum bisherigenModell, welches im Regler Verwendung findet, um 5 % modifiziert, um in der Realität auf-tretende Effekte wie die fehlerhafte Modellierung abzubilden und die Robustheit des Reglersbezüglich dieser Ungenauigkeiten zu untersuchen. Der Regler berechnet bei einer Abtastzeitvon einer Minute zu jedem Zeitschritt eine neue optimale Stelltrajektorie für die nächsten 30Minuten (tf = 30min). Die relativ kurze Rechenzeit des Reglers würde hier grundsätzlichauch eine deutlich schneller Abtastzeit zulassen. Um eine stabile Simulation der PDE-Streckesicherzustellen, wurde der vom Regler ausgegeben Massenstrom begrenzt, da es sonst auf-grund der schwierigen numerischen Struktur zu Problemen mit der numerischen Genauigkeitkam. Der verwendete Beobachter zum Schätzen der Zustände wurde um eine Ausgangsstö-rung erweitert, um eine bessere stationäre Genauigkeit im geschlossenen Kreis zu erreichen.

Die Ergebnisse für den geschlossenen Regelkreis sind in den Abbildungen 7.26 und 7.27 ge-zeigt. Aus diesen ist zu entnehmen, dass der Regler das gewünschte Sollprofil einstellen kann.Trotz der Modellreduktion und der leicht veränderten Strecke tritt dabei keine wesentlicheRegelabweichung auf. In den Verläufen von θ und θ − r sind zudem zwei charakteristischeKnicke zu erkennen – einer nach etwa 80 Minuten, der andere nach etwa 100 Minuten. Hierschaltet der Regler kurzzeitig vom Beladen auf das Entladen um, indem die Stellgröße udas Vorzeichen wechselt. Zum Zeitpunkt bei 100 Minuten wird dies vorgenommen um denstationären Fehler zu verringern. Bei 80 Minuten wird hingegen einer zu hohe Temperatur inTeilen des Speichers entgegengewirkt. Dieses leichte Überschwingen ist in Abbildung 7.27 guterkennbar. Das Überschwingen konnte bei einer vergleichsweise durchgeführten Berechnungder Lösung des Optimalsteuerungsproblems ohne Modellreduktion nicht beobachtet werden.Daher ist dieser Effekt auf die Verwendung der reduzierten Modelle, die keine exakte Wieder-gabe der optimalen Stelleingriffe ermöglichen, und vermutlich auf die größeren Abweichungenfür a und b zurückzuführen. Insgesamt ist die Performanz des Reglers aber sehr zufrieden-stellend, da alle definierten Regelziele erreicht werden. Hierdurch ermöglicht die Regelungdie Einstellung von Sollprofilen für die Speichertemperatur und damit neue Optionen für Be-triebsstrategien von solarthermischen Kraftwerken. Zusätzlich liegt hiermit ein durchgängigesBeispiel zum Entwurf einer optimalen Regelung auf Basis reduzierter Modelle für nichtlineareStrömungsprozesse vor.

133

Page 146: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

7 Anwendungsbeispiele

100 120

Zeit in Minuten20 40 60 80

Temperaturin Kelvin

0

x

1

0,5

2003004005006007008009001000

0

Abbildung 7.26: Verlauf von θ im geschlossenen Regelkreis

Temperaturin Kelvin

100120

Zeit in Minuten20 4060

80

0

x

1

0,5

0

100

0

-100-200-300-400-500-600

Abbildung 7.27: Abweichung θ − r im geschlossenen Regelkreis

134

Page 147: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

8 Zusammenfassung und Ausblick

Strömungsprozesse sind in zahlreichen technischen Anwendungen und insbesondere bei Trans-portvorgängen von Wärme und Stoff präsent. Die mathematische Beschreibungsform desStrömungsprozess ist dabei die partielle Differentialgleichung (PDE). Besitzt die strömendeEntität geschwindigkeitsabhängige Eigenschaften wie etwa einen Impuls, so sind die PDEszudem nichtlinear. Zum erfolgreichen und sicheren Einsatz vieler technischer Systeme ist dieRegelung dieser Systeme notwendig. Für die Regelung von PDEs gibt es zwei verschiedeneSchulen, wovon das late lumping den Reglerentwurf auf PDE-Ebene vornimmt, während dasearly lumping das Regelungsproblem über reduzierte Modelle zu einem bekannten endlich di-mensionalen Problem macht. In dieser Arbeit wurde hier die wissenschaftliche Lücke geschlos-sen, dass die etablierten Methoden zur Erstellung der reduzierten Modelle durch lineare Grun-dannahmen für nichtlineare Systeme nur mit Einschränkung eingesetzt werden können. Dazuwurden dreierlei Methoden vorgestellt, die – selbst nochmals in Untermethoden unterteilt –die Modellreduktion für nichtlineare Systeme verbessert sollten. In drei Anwendungsbeispielensteigender Komplexität konnte dabei nachgewiesen werden, dass die Verwendung nichtlinearerDimensionsreduktionsmethoden (wie insbesondere die Laplacian Eigenmaps und die Isomap),das Interpolieren reduzierter Modelle über Ausrichten oder Mannigfaltigkeiten und auch dieModelladaption über erweiterte joint Kalmanfilter und Closure Models die Modellreduktionverbessern konnten. Die damit verbesserte Beschreibungsgenauigkeit konnte dabei auf zwei-erlei Weise in eine verbesserte Regelgüte umgesetzt werden. Zum einen erfolgte dies durch dieVerwendung etablierte ODE-Methoden wie der Modellprädiktiven Regelung, die im konkretenFall so angepasst wurde, dass sie explizit die interpolierten Modelle der Modellinterpolationverwendet. Zum anderen wurde ein neuartiges Regelungskonzept vorgestellt, in welchem dieModellreduktion auf die Reglerbestimmungsgleichungen des late lumping angewandt wur-de. Durch diesen Ansatz wurde ein Versuch unternommen, die Schritte der Modellreduktionund des Reglerentwurfs methodisch als eine Einheit zu betrachten. Beide Regelungsverfahrenkonnten dabei in den Anwendungsbeispielen ihre Funktionstüchtigkeit unter Beweis stellen.

Trotz der aufgeführten Fortschritte, die im Zuge dieser Arbeit erzielt werden konnten, gibt esnoch viele offene Fragen und ausstehende Schritte. Auch wenn die Methoden in den Anwen-dungsbeispielen auf teilweise sehr realitätsnahe Modelle, die an Messdaten validiert wurden,angewandt wurden, so steht die Validierung an einem realen Exponat noch aus, da wederdie überströmte Oberfläche noch der Solarturm Jülich zur Verfügung standen. Auf metho-discher Ebene gibt es ebenfalls offene Punkte, von denen der Autor vor allem folgende alswichtig und vielversprechend ansieht: Für den Methode der Modellinterpolation steht nochaus, was bei einer Verwendung von Bézier-Kurven, die nur vom Grad 2 sind, für Ergebnisse

135

Page 148: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

8 Zusammenfassung und Ausblick

erzielt werden können. Grundlegender als dieses eher technische Detail sind die graphenba-sierten Verfahren zu Dimensionsreduktion. Diese berücksichtigen durch ihren topologieerhal-tendenden Ansatz den nichtlinearen Charakter der Mannigfaltigkeit. Die Tatsache, dass dasnichtlineare System ein (oft konvektionsdominanter) Strömungsprozess ist, der somit aucheine (Strömungs-)Richtung hat, wurde aber noch nicht beachtet. Hier besteht eventuell dieMöglichkeit die Informationsflussrichtung der Strömung in den Graphen und die Basisfunk-tionen zu integrieren, um das Verfahren nicht nur für nichtlineare Systeme, sondern auch fürnichtlineare Strömungen zu optimieren. Für die Modelladaption ist eine wichtige offene Frage,ob unter den zahlreichen Verfahren der online Parameterschätzung der joint Kalmanfilter fürdas gegeben Problem das beste Werkzeug ist. Hier müsste untersucht werden, ob vielleichtVerfahren wie Dual Kalmanfilter gerade mit der Problematik der Beobachtbarkeit nicht besserumgehen können.

Die in dieser Arbeit im Fokus stehenden neuen Methoden sind allesamt generalisierte Struktu-ren, die keine auf einen singulären Einzelfall hin zugeschnittenen Pariah sind, sondern sich inder hier präsentierten Form gut auf andere nichtlineare Systeme hoher Dimension anwendenlassen. Die Verwendung unterschiedlicher Anwendungsbeispiele stellte einen Versuch dar, die-se Allgemeinheit bereits in diese Arbeit mit einfließen zu lassen. Nichtsdestoweniger stellt denvermutlich größten Ausblick dieser Arbeit dar, die präsentierten Methoden schöpferisch aufneue Prozesse zu übertragen und hierdurch nicht nur diese Prozesse zu verbessern, sondernauch aus den sich beim Transfer ergebenden Anpassungen und Eigenheiten die Verfahren alssolche zu verfeinern.

136

Page 149: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Literaturverzeichnis

[1] A. Alla, C. Gräßle, and M. Hinze. A residual based snapshot location strategy forPOD in distributed optimal control of linear parabolic equations. Control of SystemsGoverned by Partial Differential Equations, 2:14–19, 2016.

[2] D. Amsallem and C. Farhat. An interpolation method for adapting reduced-order modelsand application to aeroelasticity. AIAA Journal, 46:1803–1813, 2008.

[3] D. Amsallem and C. Farhat. An online method for interpolating linear parametricreduced-order-models. SIAM Journal on Scientific Computing, 33:2169–2198, 2011.

[4] K. B. Ariyur and M. Krstic. Real Time Optimization by Extremum Seeking Control.John Wiley & Sons, 1st edition, 2003.

[5] M. Baumann, P. Benner, and J. Heiland. Space-time Galerkin POD with applicationin optimal control of semi-linear parabolic partial differential equations. pages 18–18,2016.

[6] U. Baur, P. Benner, C. A. Beattie, and S. Gugercin. Interpolatory projection methods forparameterized model reduction. SIAM Journal on Scientific Computing, 33:2489–2518,2011.

[7] U. Baur, P. Benner, and L. Feng. Model order reduction for linear and nonlinear systems:A system-theoretic perspective. Archives of Computational Methods in Engineering,21:331–358, 2014.

[8] E. Begelfor and M. Werman. Affine invariance revisited. IEEE Computer SocietyConference on Computer Vision and Pattern Recognition, 2:2087–2094, 2006.

[9] M. Belkin and P. Niyogi. Laplacian eigenmaps for dimensionality reduction and datarepresentation. SIAM Review, 15(6):1373–1396, 2003.

[10] P. Benner and L. Feng. Model order reduction for coupled problems. Applied andComputational Mathematics, 14(1):3–22, 2015.

[11] P. Benner and J. Heiland. Robust stabilization of laminar flows in varying flow regimes.IFAC PapersOnLine, 49-8:31–36, 2016.

[12] P. Benner, S. Gugercin, and K. Willcox. A survey of projection-based model reductionmethods for parametric dynamical systems. SIAM Review, 57:483–531, 2015.

[13] M. Benosman, B. Kramer, P. T. Boufanos, and P. Grover. Learning-based reducedorder model stabilization for partial differential equations: Application to the coupledBurgers equation. American Control Conference, pages 1673–1678, 2016.

137

Page 150: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Literaturverzeichnis

[14] M. Benosman, J. Borggaard, and B. Kramer. Robust POD model stabilization for the3D Boussinesq equations based on Lyapunov theory and extremum seeking. AmericanControl Conference, 2017.

[15] J. Borggaard, K. R. Pond, and L. Zietsmann. Parametric reduced order models usingadaptive sampling and interpolation. IFAC World Congress, 19:7773–7778, 2014.

[16] C. Brandenburg, F. Lindemann, M. Ulbrich, and S. Ulbrich. A continuous adjointapproach to shape optimization for Navier Stokes flow. Optimal Control of CoupledSystems of Partial Differential Equations, pages 35–56, 2009.

[17] S. L. Brunton and B. R. Noack. Closed-loop turbulence control: Progress and challen-ges. Applied Mechanics Reviews, 2015.

[18] K. Burg, H. Haf, F. Wille, and M. A. Partielle Differentialgleichungen und funktional-analytische Grundlagen. Vieweg+Teubner, 5 edition, 2010.

[19] J. Burkardt, M. Gunzburger, and H.-C. Lee. POD and CVT-based reduced-order mode-ling of Navier-Stokes flows. Computer Methods in Applied Mechanics and Engineering,196:337–355, 2006.

[20] A. Chatterjee. An introduction to the proper orthogonal decomposition. CurrentScience, 78:808–817, 2000.

[21] M. Chevalier. Feedback and adjoint based control of boundary layer flows. TechnicalReports from Royal Institute of Technology Department of Mechanics, 2004.

[22] C. Chovet, L. Keirsbulck, B. R. Noack, M. Lippert, and J.-M. Foucaut. Machine learningcontrol for experimental shear flows targeting the reduction of a recirculation bubble.IFAC World Congress, pages 12818–12822, 2017.

[23] L. Cordier and M. Bergmann. Proper orthogonal decomposition: an overview. Post-Processing of Numerical and experimental Data, 2008.

[24] L. Cordier and M. Bergmann. Two typical applications of POD: coherent structuresand reduced order modelling. Post-Processing of Numerical and experimental Data,2008.

[25] L. Cordier, B. A. E. Majd, and J. Favier. Calibration of POD reduced-order modelsusing Tikhonov regularization. International Journal for Numerical Methods in Fluids,63:269–296, 2009.

[26] L. Cordier, B. Noack, G. Tissot, G. Lehnasch, J. Delville, M. Balajewicz, G. Daviller,and R. Niven. Identification strategies for model-based control. Experiments in Fluids,54(8):1–21, 2013.

[27] M. Couplet, C. Basdevant, and P. Sagaut. Calibrated reduced-order POD-Galerkinsystem for fluid flow modelling. Journal of Computational Physics, 207:192–220, 2005.

[28] R. Curtain and H. Zwart. An Introduction to Infinite-Dimensional Linear SystemsTheory. Texts in Applied Mathematics 21, Springer-Verlag, 1995.

138

Page 151: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Literaturverzeichnis

[29] W. Dahmen and A. Reusken. Numerik für Ingenieure und Naturwissenschaftler. Sprin-ger, 2008.

[30] K. I. Diamantaras and S. Y. Kung. Prinicpal Component Neural Networks. Wiley, 1996.

[31] M. Diehl. Real-Time Optimization for Large Scale Nonlinear Processes. PhD thesis,University of Heidelberg, 2001.

[32] E. W. Dijkstra. A note on two problems in connexion with graphs. Numerische Ma-thematik, 1(1):269–271, 1959.

[33] T. Duriez, S. L. Brunton, and B. R. Noack. Machine Learning Control - TamingNonlinear Dynamics and Turbulence. Springer-Verlag, 1st edition, 2017.

[34] R. E. and R. J. Orford. Linear regression applied to system identification for adaptivecontrol systems. AIAA Journal, 1(10):2300–2306, 1963.

[35] M. Fahl. Trust-Region Methods for Flow Control Based on Reduced Order Modelling.PhD thesis, Universität Trier, 2000.

[36] H. Fattorini. Boundary control systems. SIAM Journal on Control, 6(3):349–385, 1968.

[37] C. Fletcher. Computational Galerkin Methods. Springer-Verlag, 1984.

[38] R. Freund. Model reduction methods based on Krylov subspaces. Acta Numerica, 12:267–319, 2003.

[39] A. Fursikov, M. Gunzburger, and L. Hou. Boundary value problems and optimal bounda-ry control for the Navier-Stokes system: The two-dimensional case. Journal on Controland Optimization, 36(3):852–894, 1998.

[40] P.-Y. Gousenbourger, C. Samir, and P.-A. Absil. Piecewise-Bézier C1 interpolation onRiemannian manifolds with application to 2D shape morphing. International Conferenceon Pattern Recognition, 2014.

[41] W. R. Graham, J. Peraire, and K. Tang. Optimal control of vortex shedding usinglow-order models. Part I - open loop model development. International Journal forNumerical Methods in Engineering, 1999.

[42] M. Gunzburger. Sensitivities in computational methods for optimal flow control. Com-putational Methods for Optimal Design and Control, pages 197–236, 1998.

[43] M. Gunzburger. Adjoint equation-based methods for control problems in incompressible,viscous flow. Flow, Turbulence and Combustion, 65:249–272, 2000.

[44] M. Gunzburger. Perspectives in Flow Control and Optimization. Advances in Designand Control, SIAM, 2003.

[45] M. Hakenberg. Modellreduktion und Regelung von Strömungsprozessen mit dem POD-Galerkin-Verfahren. PhD thesis, RWTH Aachen University, 2015.

[46] J. Hale. Dynamical systems and stability. Journal of Mathematical Analysis and App-lications, 26(1):39–59, 1969.

139

Page 152: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Literaturverzeichnis

[47] D. Hartmann and L. K. Mestha. A deep learning framework for model reduction ofdynamical systems. IEEE Conference on Control Technology and Applications, pages1917–1922, 2017.

[48] S. Haykin. Kalman Filtering and Neural Networks. John Wiley & Sons, 1st edition,2001.

[49] J. Heiland and V. Mehrmann. Distributed control of linearized Navier-Stokes equati-ons via discretized input/output maps. ZAMM Journal of applied mathematics andmechanics, 92(4):257–274, 2012g.

[50] L. Henning and R. King. Drag reduction by closed-loop control of a separated flowover a bluff body with a blunt trailing edge. Conference on Decision and Control, pages494–499, 2005.

[51] M. Hinze. Optimal and instantaneous control of the instationary Navier-Stokes equa-tions. Habilitationsschrift, Technische Universität Berlin, 2000.

[52] M. Hinze, R. Pinnau, M. Ulbrich, and S. Ulbrich. Optimization with PDE Constraints.Springer-Verlag, 2009.

[53] P. Holmes, J. L. Lumley, and G. Berkooz. Turbulence, Coherent Structures, DynamicalSystems and Symmetry. Cambridge University Press, 1st edition, 1996.

[54] J. Imai, K. Noso, A. Takahashi, and S. Funabiki. On mixed Galerkin modeling forcontroller design of boundary control systems. IFAC World Congress, pages 7394–7399, 2017.

[55] K. Ismail and R. Stuginsky. A parametric study on possible fixed bed models for PCMand sensible heat storage. Applied Thermal Engineering, 19:757–788, 1999.

[56] J. N. Juang and R. S. Pappa. An eigensystem realization algorithm formodal parameteridentification and model reduction. Journal of Guidance Control and Dynamics, 8(5):620–627, 1985.

[57] R. E. Kalman. When is a linear control system optimal? Transactions ASME, SeriesD, Journal of Basic Engineering, 86:51–60, 1964.

[58] W. Kühnel. Differentialgeometrie: Kurven-Flächen-Mannigfaltigkeiten. Springer-Verlag,6th edition, 2013.

[59] S. R. Koh, P. S. Meysonnat, V. Statnikov, M. Meinke, and W. Schröder. Dependenceof turbulent wall-shear stress on the amplitude of spanwise transversal surface waves.Comp. & Fluids, 199:261–275, 2015.

[60] B. Kramer. Model reduction for control of a multiphysics system: Coupled Burgersequation. American Control Conference (ACC) 2016, pages 6146–6151, 2016.

[61] M. Kramer. Nonlinear principal component analysis using autoassociative neural net-works. AIChE Jounral, 37(2):233–243, 1991.

[62] M. Krstic and A. Smyshlyaev. Boundary Control of PDEs. SIAM, 2008.

140

Page 153: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Literaturverzeichnis

[63] R. Kruse, C. Borgelt, C. Braune, F. Klawonn, C. Moewes, and M. Steinbrecher. Com-putational Intelligence: Eine methodische Einführung in Künstliche Neuronale Netze,Evolutionäre Algorithmen, Fuzzy-Systeme und Bayes-Netze. Springer-Verlag, 2th edi-tion, 2015.

[64] K. Kunisch and S. Volkwein. Control of the Burgers equation by an reduced-orderapproach using proper orthogonal decomposition. Journal of optimization theory andapplications, 102(2):345–371, 1999.

[65] K. Kunisch and S. Volkwein. Galerkin proper orthogonal decomposition methods forparabolic problems. Numerische Mathematik, 90:117–148, 2001.

[66] K. Kunisch and S. Volkwein. Proper orthogonal decomposition for optimality systems.ESAIM:M2AN, 42:1–23, 2008.

[67] J. A. Lee and M. Verleysen. Nonlinear Dimensionality Reduction. Springer-Verlag,2007.

[68] J.-L. Lions. Optimal Control of Systems Governed by Partial Differential Equations.Springer-Verlag, 1971.

[69] M. Meinke, W. Schröder, E. Krause, and T. Rister. A comparison of second-and sixth-order methods for large-eddy simulations. IComp. & Fluids, 31(4):695–718, 2002.

[70] T. Meurer. Control of Higher-Dimensional PDEs: Flatness and Backstepping Designs.Communications and Control Engineering Series, Springer-Verlag, 2013.

[71] T. Meurer. Some perspectives in PDE control. IFAC World Congress, pages 4263–4267,2017.

[72] T. Meurer and A. Kugi. Trajectory planning for boundary controlled parabolic PDEswith varying parameters on higer-dimensional spatial domains. IEEE Transactions ofAutomatic Control, 54:1854–1868, 2009.

[73] T. Meurer and A. Schaum. Control of PDEs. Lecture Notes for the Elgersburg School2016, 2016.

[74] P. S. Meysonnat, D. Roggenkamp, W. Li, B. Roidl, and W. Schröder. Experimentaland numerical investigation of transversal traveling surface waves for drag reduction.European Journal of Mechanics - B/Fluids, 55:313–323, 2016.

[75] B. C. Moore. Principal component analysis in linear systems: controllability, observa-bility, and model reduction. IEEE Transactions of Automatic Control, 26:17–32, 1981.

[76] B. R. Noack, M. Morzynski, and G. Tadmor. Reduced-Order Modelling for Flow Control.CISM Courses and Lectures 528, Springer-Verlag, 2011.

[77] J. Nocedal and S. J. Wright. Numerical Optimization. Springer-Verlag, 2006.

[78] F. Nolteernsting, D. Fischer, J. Gall, and D. Abel. Optimal storage usage in CSP: Adynamic programming approach. SolarPACES 2012. Concentrating Solar Power andChemical Energy Systems, 2012.

141

Page 154: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Literaturverzeichnis

[79] O. S. O. and T. Iliescu. Proper orthogonal decomposition closure models for fluid flows:Burgers equation. International Journal of Numerical Analyis and Modeling, 1:1–18,2013.

[80] J. Östh, B. R. Noack, S. Krajnovic, D. Baroos, and J. Borée. On the need for a nonlinearsubscale turbulence term in POD models as exemplified for a high-Reynolds-numberflow over an Ahmed body. Journal of Fluid Mechanics, 747:518–544, 2014.

[81] B. Protas, B. R. Noack, and J. Östh. Optimal nonlinear eddy viscosity in Galerkinmodels of turbulent flows. Journal of Fluid Mechanics, 766:337–367, 2015.

[82] L. Pyta and D. Abel. Model based control of the incompressible Navier-Stokes-equationsusing interpolatory model reduction. Proceedings of the Conference on Decision andControl, pages 7316–7321, 2015.

[83] L. Pyta and D. Abel. Nonlinear model reduction of the Navier-Stokes-Equations. Ame-rican Control Conference, pages 5249–5254, 2016.

[84] L. Pyta and D. Abel. Interpolatory Galerkin models for the Navier-Stokes-equations.2nd IFAC Workshop on Control of Systems Governed by Partial Differential Equations,pages 206–211, 2016.

[85] L. Pyta and D. Abel. Online model adaptation of reduced order models for fluid flows.IFAC World Congress, pages 11630–11635, 2017.

[86] L. Pyta, M. Hakenberg, and D. Abel. Model reduction and control of a compressiblechannel flow with combustion. IFAC World Congress, 19:7001–7006, 2014.

[87] L. Pyta, M. Herty, and D. Abel. Optimal feedback control of the incompressible Navier-Stokes-equations using reduced order models. Conference on Decision and Control(CDC) 2015, pages 2519–2524, 2015.

[88] L. Pyta, P. Meysonnat, W. Schröder, and D. Abel. Space-selective nonlinear reduced-order models for turbulent boundary layer drag reduction. IEEE Conference on ControlTechnology and Applications, pages 383–388, 2017.

[89] L. Pyta, F. Nolteernsting, and D. Abel. Verteiltparametrische Modellierung und Rege-lung eines thermischen Festbettspeichers. at Automatisierungstechnik, 65(5):350–366,2017.

[90] C. Raibaudo, P. Zhong, R. J. Martinuzzi, and B. R. Noack. Open and closed-loopcontrol of a triangular bluff body using rotating cylinders. IFAC World Congress, pages12802–12806, 2017.

[91] M. L. Rapun, F. Terragni, and J. M. Vega. Adaptive POD-based low-dimensional mo-deling supported by residual estimates. Journal for Numerical Methods in Engineering,pages 844–868, 2015.

[92] S. S. Ravindran. Reduced-order adaptive controllers for fluid flows using POD. Journalof Scientific Computing, 15(4):457–478, 2000.

142

Page 155: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Literaturverzeichnis

[93] D. Rempfer. Kohärente Strukturen und Chaos beim laminar-turbulenten Grenzschich-tumschlag. PhD thesis, Universität Stuttgart, 1991.

[94] P. Ricco and S. Hahn. Turbulent drag reduction through rotating discs. Journal ofFluid Mechanics, 722:267–290, 2013.

[95] C. W. Rowley. Model reduction for fluids using balanced proper orthogonal decompo-sition. International Journal on Bifurcation and Chaos, pages 997–1013, 2005.

[96] C. W. Rowley and S. T. M. Dawson. Model reduction for flow analysis and control.Annual Review of Fluid Mechanics, pages 387–417, 2017.

[97] A. P. Ruszczynski. Nonlinear Optimization. Princeton University Press, 2006.

[98] J. W. Sammon. A nonlinear mapping for data structure analysis. IEEE Transactionson Computers, 18(5):401–409, 1969.

[99] O. San and J. Borggaard. Basis selection and closure for POD models of convectiondominated Boussinesq flows. 21st International Symposium on Mathematical Theoryof Networks and Systems, pages 132–139, 2014.

[100] P. J. Schmid. Dynamic mode decomposition of numerical and experimental data.Journal of Fluid Mechanics, 656:5–28, 2010.

[101] M. Scholz. Nichtlineare Hauptkomponentenanalyse auf Basis neuronaler Netze. Di-plomarbeit, 2002.

[102] M. Scholz and R. Vigrio. Nonlinear PCA: a new hierarchical approach. ESANN (M.Verleysen, ed.), pages 439–444, 2002.

[103] J. Schröck, T. Meurer, and A. Kugi. Non-collocated feedback stabilization of a non-uniform Euler-Bernoulli beam with in-domain actuation. Conference on Decision andControl, pages 2776–2781, 2011.

[104] B. Schörkhuber, T. Meurer, and A. Jüngel. Flatness-based trajectory planning forsemilinear parabolic PDEs. Conference on Decision and Control, pages 3538–3543,2012.

[105] B. Schweizer. Partielle Differentialgleichungen - Eine anwendungsorientierte Einfüh-rung. Springer-Verlag, 2013.

[106] B. Seibold. A compact and fast Matlab code solving the incompressible Navier-Stokesequations on rectangular domains. Massachusetts Institute of Technology, 2008.

[107] R. Serban, C. Homescu, and L. R. Petzold. The effect of problem perturbations onnonlinear dynamical systems and their reduced order models. SIAM Journal on ScientificComputing, 29:2621–2643, 2007.

[108] V. D. Silva and J. B. Tenenbaum. Global versus local methods in nonlinear dimensio-nality reduction. Advances in neural information processing systems, pages 705–712,2002.

[109] D. Simon. Optimal State Estimation. John Wiley & Sons, 1st edition, 2006.

143

Page 156: Modellreduktion und optimale Regelung nichtlinearer ...publications.rwth-aachen.de/record/721452/files/721452.pdf · Modellreduktion und optimale Regelung nichtlinearer Strömungsprozesse

Literaturverzeichnis

[110] L. Sirovich. Turbulence and the dynamic of coherent structures part I: Coherent struc-tures. Quaterly of Applied Mathematics, XLV:561–571, 1987.

[111] A. Smyshlaev and M. Krstic. Backstepping observers for a class of parabolic PDEs.System & Control Letters, 54:613–625, 2005.

[112] R. Temam. Navier-Stokes Equations and Nonlinear Functional Analysis. Siam, 1995.

[113] J. B. Tenenbaum, V. D. Silva, and J. C. Langford. A global geometric framework fornonlinear dimensionality reduction. Science, 290(5500):2319–2323, 2000.

[114] N. Tomiyama and K. Fukagata. Direct numerical simulation of drag reduction in aturbulent channel flow using spanwise traveling wave-like wall deformation. Physics ofFluids, 25:105115–105115–21, 2013.

[115] E. Touber and M. A. Leschziner. Near-wall streak modification by spanwise oscillatorywall motion and drag-reduction mechanisms. Journal of Fluid Mechanics, 693:150–200,2012.

[116] F. Tröltzsch. Optimale Steuerung partieller Differentialgleichungen. Vieweg+Teubner,2009.

[117] M. Ulbrich. Constrained optimal control of Navier-Stokes flow by semismooth Newtonmethods. Systems & Control Letters, 48:297–311, 2003.

[118] R. Vazquez and M. Krstic. A closed-form feedback controller for stabilization of thelinearized 2D Navier-Stokes Poiseuille flow. IEEE Transactions on Automatic Control,52:2298–2312, 2007.

[119] R. Vazquez and M. Krstic. Control of 1-D parabolic PDEs with Volterra nonlinearities- Part I: Design. Automatica, 44:2778–2790, 2008.

[120] R. Vazquez and M. Krstic. Control of 1-D parabolic PDEs with Volterra nonlinearities- Part II: Analysis. Automatica, 44:2791–2803, 2008.

[121] R. Vazquez and M. Krstic. Taking a step back: A brief history of PDE backstepping.IFAC World Congress, pages 4258–4262, 2017.

[122] J. Wang. Geometric structure of high-dimensional data and dimensionality reduction.Springer-Verlag, 2011.

[123] J. F. Wendt. Computational Fluid Dynamics: An introduction. Springer-Verlag, 1995.

[124] D. Werner. Funktionalanalysis. Springer-Verlag, 7 edition, 2011.

[125] D. Xiao, F. Fang, A. G. Buchan, C. C. Pain, I. M. Navon, J. Du, and G. Hu. Non-linearmodel reduction for the Navier-Stokes equations using residual DEIM method. Journalof Computational Physics, 263:1–18, 2014.

[126] H. Zwart. On Fattorinis paper: Boundary Control Systems. IFAC World Congress,pages 4248–4251, 2017.

144