institut für mikroelektronische systeme methoden zur ...¤sentation.pdfinstitut für...

28
Institut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund Methoden zur applikationsspezifischen Verlustleistungsoptimierung für eingebettete Prozessoren Sebastian Hesselbarth, Holger Blume Institut für Mikroelektronische Systeme, Leibniz Universität Hannover {hesselbarth, blume}@ims.uni-hannover.de

Upload: lemien

Post on 05-Aug-2019

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Institut für Mikroelektronische Systeme

15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Methoden zur applikationsspezifischen Verlustleistungsoptimierung für eingebettete ProzessorenSebastian Hesselbarth, Holger Blume

Institut für Mikroelektronische Systeme, Leibniz Universität Hannover{hesselbarth, blume}@ims.uni-hannover.de

Page 2: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Motivation Modellierung der Verlustleistung

Hybrid Functional Level/Instruction Level Power Analysis Erweiterung der Hybrid FLPA/ILPA

Modellierung für Prozessoren im Entwurfsstadium Vorgehensweise Identifikation von Einflussfaktoren auf Verlustleistung

Emulation der Verlustleistungsmodelle Integration und Aufbau des Moduls zur Bestimmung der Verlustleistung

Evaluation der Verlustleistungsmodelle Zusammenfassung

Überblick

2

Page 3: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Steigende Leistungsanforderungen an mobile Anwendungen Sinkende Strukturgrößen erlauben leistungsfähige Multiprozessor-Chips

Batteriebetrieb begrenzt Laufzeit drastisch Verlustleistung muss stärker beachtet werden

Optimierung von Verlustleistung undEnergieverbrauch

Anwendungsfelder Mobile Endgeräte Hörgeräte Medizinische Implantate

Anforderungen an mobile Anwendungen

3

Page 4: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Optimierung der Leistungsfähigkeit während der Entwicklung HW/SW-Codesign mit funktionaler Emulation auf FPGA üblich Abbildung der Funktion des Prozessors auf FPGA

mit geringerer Taktfrequenz (Faktor ca. 0,1-0,5) Gleichzeitige Entwicklung von Hardware und Software Vergrößert Optimierungspotential Verkürzung der Time-to-Market

Entwicklung für mobile Anwendungen

4

Page 5: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Optimierung der Leistungsfähigkeit während der Entwicklung HW/SW-Codesign mit funktionaler Emulation auf FPGA üblich Abbildung der Funktion des Prozessors auf FPGA

mit geringerer Taktfrequenz (Faktor ca. 0,1-0,5) Gleichzeitige Entwicklung von Hardware und Software Vergrößert Optimierungspotential Verkürzung der Time-to-Market

Optimierung der Verlustleistung erst nach Fertigung des ASIC Keine Messung am Chip möglich Nur sequentielle Optimierung von Hardware und Software Verringertes Optimierungspotential Verlängerung der Time-to-Market

Entwicklung für mobile Anwendungen

5

Page 6: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Dynamische Verlustleistung Elektrische Kapazität C Versorgungsspannung V Betriebsfrequenz f Schaltaktivität α (Häufigkeit der Umladevorgänge)

Verlustleistungsbestimmung während des Entwurfs

6

2dynP C V f

Page 7: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Dynamische Verlustleistung Elektrische Kapazität C Versorgungsspannung V Betriebsfrequenz f Schaltaktivität α (Häufigkeit der Umladevorgänge)

Simulation der technologieabhängigen Gatter-Netzliste (ASIC) Extraktion der Schaltaktivität Verlustleistungssimulation Sehr langsame Simulationsgeschwindigkeit (10-50Hz)

Ermittlung der Verlustleistung ganzer Anwendungen unmöglich Kaum Beachtung realer Eingangsdaten

Verlustleistungsbestimmung während des Entwurfs

7

2dynP C V f

Page 8: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Dynamische Verlustleistung Elektrische Kapazität C Versorgungsspannung V Betriebsfrequenz f Schaltaktivität α (Häufigkeit der Umladevorgänge)

Simulation der technologieabhängigen Gatter-Netzliste (ASIC) Extraktion der Schaltaktivität Verlustleistungssimulation Sehr langsame Simulationsgeschwindigkeit (10-50Hz)

Ermittlung der Verlustleistung ganzer Anwendungen unmöglich Kaum Beachtung realer Eingangsdaten

Abstraktion von der zeitintensiven Gatter-Ebene erforderlich

Verlustleistungsbestimmung während des Entwurfs

8

2dynP C V f

Page 9: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Differenzierung auf funktionaler Ebene (FLPA) Funktion der Einheit bestimmt Verlustleistung z.B. Anzahl der ausgeführten Instruktionen, Cache-Misses, Speicherzugriffe

Differenzierung auf Instruktionsebene (ILPA) Ausgeführte Instruktion bestimmt Verlustleistung z.B. Addition/Subtraktion, Multiplikation, Laden/Speichern

Modellierung der Verlustleistung

9

Page 10: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Differenzierung auf funktionaler Ebene (FLPA) Funktion der Einheit bestimmt Verlustleistung z.B. Anzahl der ausgeführten Instruktionen, Cache-Misses, Speicherzugriffe

Differenzierung auf Instruktionsebene (ILPA) Ausgeführte Instruktion bestimmt Verlustleistung z.B. Addition/Subtraktion, Multiplikation, Laden/Speichern

Hybrid Functional Level/Instruction Level Power Analysis Hybride Modellierung vereint FLPA und ILPA Modellbildung durch Messung der Verlustleistung

am realisierten Chip durch gezielte Anregung des Prozessors

Modellierung der Verlustleistung

10

Page 11: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Erweiterung der Hybrid FLPA/ILPA

11

Page 12: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Bildung der arithmetischen Modelle Messung am noch nicht realisierten Chip unmöglich Gatter-Simulation mit kurzen Programmsequenzen Extraktion instruktionsspezifischer Schaltaktivität einzelner Module

Erweiterung der Hybrid FLPA/ILPA

12

Page 13: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Bildung der arithmetischen Modelle Messung am noch nicht realisierten Chip unmöglich Gatter-Simulation mit kurzen Programmsequenzen Extraktion instruktionsspezifischer Schaltaktivität einzelner Module

Integration in die funktionale Emulation auf FPGAs Nutzung der Emulation zur Anwendung der arithmetischen Modelle Großer Geschwindigkeitsgewinn (50-150MHz) Ermöglicht Untersuchung ganzer Anwendungen

Erweiterung der Hybrid FLPA/ILPA

13

Page 14: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Motivation Modellierung der Verlustleistung

Hybrid Functional Level/Instruction Level Power Analysis Erweiterung der Hybrid FLPA/ILPA

Modellierung für Prozessoren im Entwurfsstadium Vorgehensweise Identifikation von Einflussfaktoren auf Verlustleistung

Emulation der Verlustleistungsmodelle Integration und Aufbau des Moduls zur Bestimmung der Verlustleistung

Evaluation der Verlustleistungsmodelle Zusammenfassung

Überblick

14

Page 15: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Methodik zur Verlustleistungsmodellierung

15

Architektur-beschreibung

Hardware-beschreibung

Micro-Benchmarks

Gatter-Netzliste

Logiksimulation (Gatter- und Register-Ebene)und Verlustleistungssimulation

InstruktionsspezifischeVerlustleistungsmodelle

Schaltaktivität Verlustleistung

Page 16: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Gaisler Research (GPL) Sparc v8 Architektur 5-stufige Pipeline Instruktions-/Daten-Cache Lokale Speicher für

Instruktionen und Daten FPU, Coprozessor (optional)

40nm LP Standardzell-Bibliothek für 500 MHz

LEON-2 RISC-Prozessor

16

Page 17: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Einmalige Simulation vonkurzen Mikro-Benchmarks

Wiederholte Ausführungeiner Instruktion

Ausführungszeit ca. 5-10 Minuten/Instruktion

Gut parallelisierbar Maß für Schaltaktivität

zeitliche Hamming-Distanz

Modellbildung durchLineare Regressions-Analyse

Instruktionsspezifische Verlustleistung

17

5.0

4.0

3.0

2.0

2.0

5.0

4.0

3.0

P /

mW

iu

, ( ) ( , )IU I 0 i ii

P t k a HD t x

k0

ai

Page 18: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Motivation Modellierung der Verlustleistung

Hybrid Functional Level/Instruction Level Power Analysis Erweiterung der Hybrid FLPA/ILPA

Modellierung für Prozessoren im Entwurfsstadium Vorgehensweise Identifikation von Einflussfaktoren auf Verlustleistung

Emulation der Verlustleistungsmodelle Integration und Aufbau des Moduls zur Bestimmung der Verlustleistung

Evaluation der Verlustleistungsmodelle Zusammenfassung

Überblick

18

Page 19: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Anwendung der Verlustleistungsmodelle

19

modifizierteHardware-

beschreibung

FPGA-Netzliste

Instr.spez.Verlustleistungs-

modelle

Modul zurBerechnung d.Verlustleistung

Emulationsumgebung (Emulationssystem und Host-PC)

Applikation

Binärdatei

geschätzte applikationsspezifische Verlustleistung

Page 20: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

BEEcube BEE4 Emulationssystem 4x Xilinx Virtex-6 LX550T Je 2x 4GB DDR3 SDRAM-Module Je 1x Gigabit Ethernet (GbE)

FPGA LEON-2 Prozessor Modul zur Bestimmung der Verlustleistung Kommunikationsmodul

Standard Host-PC Datentransfer Emulations-Steuerung Visualisierung des zeitlichen Verlaufes

der Verlustleistung

Aufbau der Emulationsumgebung

20

Page 21: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Durchführen aller Berechnungen Geringfügige Modifikation der LEON-2

Hardware-Beschreibung erforderlich Zugriff auf interne Signale des Prozessors

Speicher für Regressions-Koeffizienten Speichern der Ergebnisse in SDRAM Geringer Ressourcenbedarf

1,4% der LUTs des FPGAs bzw.11,6% der LUTs des Prozessorkerns

2,5% der BlockRAMs des FPGAs

Kein Einfluss auf erreichbareEmulationsgeschwindigkeit

Modul zur Berechnung der Verlustleistung

21

Bus-Slave

Koeffizienten-Speicher

Bus-Master

Steu

erun

g

Berechnung derHamming-Distanzen

Mittelwert-bildung

Berechnung der Verlustleistung(Regressionsgerade)

Bus-Steuerung(Adressen)

GenerierungInstruktions-

adresse

LEON-2 Integer Unit

Page 22: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Motivation Modellierung der Verlustleistung

Hybrid Functional Level/Instruction Level Power Analysis Erweiterung der Hybrid FLPA/ILPA

Modellierung für Prozessoren im Entwurfsstadium Vorgehensweise Identifikation von Einflussfaktoren auf Verlustleistung

Emulation der Verlustleistungsmodelle Integration und Aufbau des Moduls zur Bestimmung der Verlustleistung

Evaluation der Verlustleistungsmodelle Zusammenfassung

Überblick

22

Page 23: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Auswahl typischer Algorithmen für eingebettete Systeme Einfluss von Entscheidungen auf Applikationsebene

Algorithmische Varianten und Compiler-Optimierungen

Anwendung der Verlustleistungsmodelle

23

Benchmark #Zyklen %MAE NRMSE

Quicksort, Os 9.401.600 3,01% 6,89%

Quicksort, O3 9.111.040 2,15% 4,68%

Lowpass 3x3, Variante A, Os 2.063.360 3,92% 10,30%

Lowpass 3x3, Variante A, O3 1.700.480 4,36% 6,75%

Lowpass 3x3, Variante B, O3 1.547.520 3,82% 9,50%

Durchschnitt (alle Benchmarks) 3,86% 7,88%

Page 24: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Auswahl typischer Algorithmen für eingebettete Systeme Einfluss von Entscheidungen auf Applikationsebene

Algorithmische Varianten und Compiler-Optimierungen

Anwendung der Verlustleistungsmodelle

24

Benchmark #Zyklen %MAE NRMSE

Quicksort, Os 9.401.600 3,01% 6,89%

Quicksort, O3 9.111.040 2,15% 4,68%

Lowpass 3x3, Variante A, Os 2.063.360 3,92% 10,30%

Lowpass 3x3, Variante A, O3 1.700.480 4,36% 6,75%

Lowpass 3x3, Variante B, O3 1.547.520 3,82% 9,50%

Durchschnitt (alle Benchmarks) 3,86% 7,88%

-3%

Page 25: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Auswahl typischer Algorithmen für eingebettete Systeme Einfluss von Entscheidungen auf Applikationsebene

Algorithmische Varianten und Compiler-Optimierungen

Anwendung der Verlustleistungsmodelle

25

Benchmark #Zyklen %MAE NRMSE

Quicksort, Os 9.401.600 3,01% 6,89%

Quicksort, O3 9.111.040 2,15% 4,68%

Lowpass 3x3, Variante A, Os 2.063.360 3,92% 10,30%

Lowpass 3x3, Variante A, O3 1.700.480 4,36% 6,75%

Lowpass 3x3, Variante B, O3 1.547.520 3,82% 9,50%

Durchschnitt (alle Benchmarks) 3,86% 7,88%

-17%

-9%

Page 26: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Beispiel: Lowpass-Filter 3x3 Variante A: Rechenlastig (Shift)

Variante B: Speicherlastig (Load Byte)

Ergebnisse: Einfluss von algorithmischen Varianten

26

Page 27: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Beispiel: Lowpass-Filter 3x3 Variante A: Rechenlastig (Shift)

Variante B: Speicherlastig (Load Byte)

Ergebnisse: Einfluss von algorithmischen Varianten

27

-9%

Page 28: Institut für Mikroelektronische Systeme Methoden zur ...¤sentation.pdfInstitut für Mikroelektronische Systeme 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013,

Sebastian Hesselbarth, 15. ITG-Fachtagung für Elektronische Medien, 26.-27. Februar 2013, Dortmund

Institut für Mikroelektronische Systeme

Notwendigkeit zur Optimierung der Verlustleistung Methodik zur Verlustleistungsmodellierung

Erweiterung der Hybrid FLPA/ILPA Prozessoren im Entwurfsstadium Integration in die funktionale Emulation

Evaluation der Methodik an realem Beispiel Signifikanter Unterschied im Energiebedarf

Zusammenfassung

28