was die cloud mit einem brennenden haus zu tun hat
TRANSCRIPT
oder
Was die Cloud mit einem brennenden
Haus zu tun hat
Hybride Cloud-Szenarien
02.11.2016
Prof. Dr. Nane Kratzke
Ein Vortrag über ...
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 2
häufig genannte Bedenken warum Cloud-basierte Geschäftsmodelle vermieden werden:
• Verfügbarkeit
• Sicherheit
• Vendor Lock-In (Fokus dieses Vortrags)• Kosten (Ausblick) Presentation URL
„Ein Ring sie zu knechten,ein Ring sie zu finden,ein Ring sie ins Dunkel zu treibenund ewig zu binden.“
Oder um im Genre zu bleiben:
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 3
FLUCHTWEG (Agenda)
4
Was heißt es, wenn die Cloud brennt?
Wie lang ist eigentlich ihr Fluchtweg?
Wer kümmert sich eigentlich um Brandschutz in der Cloud?
Baulicher Brandschutz und Fluchtwege?
Wieso eigentlich das Risiko eingehen?
Was ist ihr sehnlichster Wunsch in einem brennenden Haus?
Raus! Und zwar schnell ...
Cloud TRANSIT (ein Forschungsprojekt)
7
• Es gibt viele Ansätze um in die Cloud zu kommen.
• aber kaum (praktikable) Ansätze eine Cloud zu verlassen oder zu wechseln.
• Jedoch: Wer weiß wie man rauskommt, ist eher bereit hineinzugehen.
Was heißt es nun, wenn die Cloud brennt ...
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 8
• Provider ist insolvent ...
• Provider hebt Preise ...
• Provider reduziert meine Ressourcen-Limits ...
• Provider kündigt meinen Vertrag ...
• Provider hat Verfügbarkeitsprobleme ...
• Geänderte Gesetzeslage (Datenschutz) ...
• Sonstige Governance/Compliance Gründe (EU-Daten auf US-Boden?)
• Sonstige Image-Gründe (z.B. Verdi-Services auf AWS?)
Es gibt viele (schwer prognostizierbare) Gründe eine Cloud verlassen zu müssen.
FLUCHTWEG (Agenda)
9
Was heißt es, wenn die Cloud brennt?
Wie lang ist eigentlich ihr Fluchtweg?
Wer kümmert sich eigentlich um Brandschutz in der Cloud?
Baulicher Brandschutz und Fluchtwege?
Wieso eigentlich das Risiko eingehen?
Beispiel: Instagram
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 10
• Weltweites Social Network zum Image-Sharing
• 20 Mitarbeiter
• Hosted on Amazon Web Services
• Marktwert 1 Mrd USD (das zahlte zumindest Facebook)
• Keine nennenswerten IT-Assets oder gar Rechenzentren (außer 20 Laptops)
JahreEs dauerte nur
Beispiel: Instagram
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 11
• Etwa 1 Jahr für Analysen und
• Entwicklung von Toolings (insb. IP Collision Handling)
• Ca. 4 bis 8 Wochen für die eigentliche Migration
Frage: Wie lange benötigte Instagram, um seine Services in die Rechenzentren von Facebook zu migrieren?
???
Das war kein ad-hoc Umzug!
Ihr Fluchtweg kann also lang, ...
... einsam,
beschwerlich
und fernab jeder Datenautobahn verlaufen.
FLUCHTWEG (Agenda)
13
Was heißt es, wenn die Cloud brennt?
Wie lang ist eigentlich ihr Fluchtweg?
Wer kümmert sich eigentlich um Brandschutz in der Cloud?
Baulicher Brandschutz und Fluchtwege?
Wieso eigentlich das Risiko eingehen?
Wussten sie ...Mehr als 95% aller Unternehmen sind Klein- und Kleinstunternehmen
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 14
KleinstunternehmenKleinunternehmenMittlere UnternehmenGroßunternehmen
Kategorie Mitarbeiter Umsatz
Kleinstunternehmen < 10 < 2 Mio. €
Kleinunternehmen < 50 < 10 Mio. €
Mittleres Unternehmen < 250 < 50 Mio. €
Großunternmehmen >= 250 >= 50 Mio. €
Verteilung von IKT Unternehmen in Europa (2014), EUSTAT
Aktuelle Cloud Computing Forschung ...
Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 15
• hat häufig implizite Annahmen:
• Beliebige Firmen mit
• großen IT-Abteilungen und der Fähigkeit
• beliebige Komplexität von Tools und Methoden beherrschen zu können.
• Diese “Super Tanker“ müssen keine Angst vor Unannehmlichkeiten wie Vendor Lock-In haben.
Unser Zielgruppe ist anders ...
Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 16
• Segelboot vs. Supertanker (Wetter)
• Kleine und mittlere Unternehmen
• 1 Personen IT-Abteilungen
• Public und Private Cloud Computing
• Wir untersuchen die Eignung von
• Container Technologien (z.B. Docker)
• Container Cluster (z.B. Kubernetes, Swarm, Mesos)
Unsere Erfahrung ....
Brandschutz (nicht nur) für kleine (d.h. 95% aller) Unternehmen sieht häufig
so aus ...
Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 17
FLUCHTWEG (Agenda)
18
Was heißt es, wenn die Cloud brennt?
Wie lang ist eigentlich ihr Fluchtweg?
Wer kümmert sich eigentlich um Brandschutz in der Cloud?
Baulicher Brandschutz und Fluchtwege?
Wieso eigentlich das Risiko eingehen?
Good News ...
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 19
2006
2 von Standards abgedeckte Cloud
Services
2016
11 von Standards abgedeckte Cloud
Services
5 x mehr Standardisierung in 10 Jahren !!!
Am Beispiel:
Wesentliche (bittere) Erkenntnis
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 20
2 2
2 4 6 77
7 7 11 11
1 1
2 4 7 1014
21 26 42 44
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
Relationofconsid
eredservices
consideredbyCIMI,OCCI,CDMI,OVF,OCI,TOSCA notconsidered
Die Relation von standardisierten zu nicht standardisierten Diensten nahm aber dennoch über die letzten 10 Jahren ab!
Analyzed using over 2300 offical release notes of Amazon Web Services (AWS). Data for other providers like Google, Azure, Rackspace, etc. not presented. Basic conclusions for theseproviders are the same.
Cloud-native Applikativensind anfällig für Vendorlock-in Situationen. Dies
gilt insb. für KMU.
Das Cloud-Native Reference Model (ClouNS)
Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 21
Populäre Container-Cluster
Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 22
Docker SwarmSwarm Mode (Docker
1.12) kopiert Kubernetes-artige
Steuerungsprozesse. Kapselt diese aber in nur noch einer Komponenten und ist Secure by default(control and data plane). Versteckt damit Betriebs-
Komplexität.
GoogleSteuerungsprozesse die
kontinuierlich einen beabsichtigen Zustand einer
verteilten Applikation mit einem tatsächlichen Zustand
vergleichen, und bei Bedarf erforderliche Gegen-
maßnahmen automatisiert zu veranlassen. Nachfolger des
Google internen Borg Systems.
MesosphereApache Mesos ist ein
Datacenter Operating System für fein granulare Resourcen
Allokation. Mesos wird seit Jahren erfolgreich eingesetzt, um large scale Datacenters zu betreiben (Twitter, Netflix, ...)
Entwicklung von elatischen Plattformen (Open Source) ...
Vermeiden von Vendor Lock-In mittels existierender Container-Technologien
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 23
Operate application on current provider.
Scale cluster into prospective provider.
Shutdown nodes on current provider. Cluster reschedules lost container.
Migration finished.
Pets
Cattle
FLUCHTWEG (Agenda)
24
Was heißt es, wenn die Cloud brennt?
Wie lang ist eigentlich ihr Fluchtweg?
Wer kümmert sich eigentlich um Brandschutz in der Cloud?
Baulicher Brandschutz und Fluchtwege?
Wieso eigentlich das Risiko eingehen?
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 25
Kostenassoziativät
Neue Geschäftsmodelle
z.B. Kostenassoziativität
z.B. Peak Loads
Berkley View of Cloud Computing, 2009: Kostenassoziativität im Cloud Computing
26
Es kostet dasselbe ...
... 720 Server
für eine Stunde
oder einen Server für
720 Stunden zu betreiben.
Wir haben Angst vor Peak Loads, nur warum?
27
„In other words, even if cloud services cost, say, twice as much, a pure cloud solution makes sense forthose demand curves where the peak-to-average ratiois two-to-one or higher.“Weinman, Mathematical Proof of the Inevitability of Cloud Computing, 2011
http://www.joeweinman.com/Resources/Joe_Weinman_Inevitability_Of_Cloud.pdf
Analysierter Anwendungsfall
• Webtechnologie Vorlesung und Praktikum Semester SS2011, SS2012, WS2012/13.
• Projekte: Entwicklung eines Web Information Systems
• Allen Studierendengruppen konnten nach eigenem Ermessen Ressourcen von Amazon Web Services (AWS) anfordern.
• Analyse der Kosten- und Resourcennutzung von Studierenden.
Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 28
Average to Peak Ratio pro Woche
29Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems
13 14 15 16 17 18 19 20 21 22 23 24 25
Average Box UsageMaximum Box Usage in an hour
(A)Maximum and Average Box Usage
Calendar Week
Use
d S
erve
r Box
es
010
2030
4050
13 14 15 16 17 18 19 20 21 22 23 24 25
(B)Accumulated Processing Hours per Week
Calendar WeekP
roce
ssin
g H
ours
0500
1000
1500
2000
14 16 18 20 22 24
0.0
0.2
0.4
0.6
0.8
1.0(C)
Average Box to Maximum Box Ratioaccording to Weinman
Calendar Week
Avg
to M
ax B
ox U
sage
Rat
io
Cloud computing iseconomical reasonable
Cloud computingmight be reasonable
Cloud computing iseconomical not reasonable
Ergebnis
30
Eine Cloud-basierte Lösungen bietet einen mehr als 25-fachen Kostenvorteil.
Das gemessene ATP Ratio von 0.035 bedeutet einen 1/0.035 == 28.57 fachen Kostenvorteil für einen Cloud Provider.
Verglichen mit einer Inhouse-Labor Lösung.
FLUCHTWEG (Agenda)
31
Was heißt es, wenn die Cloud brennt?
Wie lang ist eigentlich ihr Fluchtweg?
Wer kümmert sich eigentlich um Brandschutz in der Cloud?
Baulicher Brandschutz und Fluchtwege?
Wieso eigentlich das Risiko eingehen?
Zusammenfassung
• Sie wollen in die Cloud?
• Machen Sie sich VORHER über Fluchtwege vertraut!
• Fördern Sie doch mal Forschung für KMU (so teuer ist das gar nicht)
• d.h. für 95% aller Unternehmen
• (und nicht nur für 5%)
• Neue Geschäftsmodelle dank ...
• Kostenassoziativität
• Kostenvorteile insb. bei stark variierenden Workloads (peak, unpredictable, rising, falling, once in a lifetime, periodical workloads)
About
Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 33
CoSA: https://cosa.fh-luebeck.de/en/contact/people/n-kratzke
Blog: http://www.nkode.io
Twitter: @NaneKratzke
GooglePlus: +NaneKratzke
LinkedIn: https://de.linkedin.com/in/nanekratzke
GitHub: https://github.com/nkratzke
ResearchGate: https://www.researchgate.net/profile/Nane_Kratzke
SlideShare: http://de.slideshare.net/i21aneka
Prof. Dr. rer. nat. Nane Kratzke
Acknowledgement
• Mordor Meme by imgflip.com• All other pictures taken from Pixabay.com (CC0 Licence)
Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 34
Our research is funded by German Federal Ministry of Education and Research
(Project Cloud TRANSIT, 03FH021PX4). We thank fat IT solution GmbH (Kiel)
for their support of Cloud TRANSIT.
Picture ReferencePresentation URL
Backup Slides
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 35
Cloud-native Applikationen
Cloud-native Applikationen haben eine hohe technische Abhängigkeit von unterliegenden Cloud
Infrastrukturen. Cloud TRANSIT untersucht, wie man Cloud-native Applikationen bauen und
betreiben sollte, um solche Abhängigkeiten zu reduzieren.
DEFINITION: A cloud-native application is a (micro)service-based, elastic and horizontal scalable application where each self-containeddeployment unit of that application is designedaccording to cloud-focused software design patternsand operated on a self-service agile elastic platform.
Gemessene Ressourcennutzung
37Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems
13 14 15 16 17 18 19 20 21 22 23 24 25
Average Box UsageMaximum Box Usage in an hour
(A)Maximum and Average Box Usage
Calendar Week
Use
d S
erve
r Box
es
010
2030
4050
13 14 15 16 17 18 19 20 21 22 23 24 25
(B)Accumulated Processing Hours per Week
Calendar Week
Pro
cess
ing
Hou
rs
0500
1000
1500
2000
14 16 18 20 22 24
0.0
0.2
0.4
0.6
0.8
1.0
(C)Average Box to Maximum Box Ratio
according to Weinman
Calendar Week
Avg
to M
ax B
ox U
sage
Rat
io
Training
Project 24x7 Migration
Woher kommt dieser Kostenvorteil?
Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 38
13 14 15 16 17 18 19 20 21 22 23 24 25
Average Box UsageMaximum Box Usage in an hour
(A)Maximum and Average Box Usage
Calendar Week
Use
d S
erve
r Box
es
010
2030
4050
13 14 15 16 17 18 19 20 21 22 23 24 25
(B)Accumulated Processing Hours per Week
Calendar Week
Pro
cess
ing
Hou
rs
0500
1000
1500
2000
14 16 18 20 22 24
0.0
0.2
0.4
0.6
0.8
1.0
(C)Average Box to Maximum Box Ratio
according to Weinman
Calendar Week
Avg
to M
ax B
ox U
sage
Rat
io
Wie müssen sie ihr Datacenter dimensionieren?peak load
Was wird nur benötigt?
averageload
Und das Delta?
Misst die Überdimensionierung ...
Wie macht man aus einem KMU ein Instagram?
Prof. Dr. rer. nat. Nane KratzkePraktische Informatik und betriebliche Informationssysteme 39
Einfach 20 Tech Nerds wie ihn ...
Das funktioniert vielleicht im Silicon Valley, ...
... Aber die meisten Firmen verkaufen Domänen-spezifische Dienste und beschäftigen daher Domänenexperten und keine Cloud-Experten (das ist sogar im Software Engineering so).
Gibt es einen anderen Weg?
... anheuern. Die wissen wie man das letzte aus einer Cloud herausholt.
Do you considered network latencies?You are relying on SDN ...
Prof. Dr. rer. nat. Nane KratzkeComputer Science and Business Information Systems 40
Data transfer in relative comparison(bigger is better)
Message Size (kB)
Rat
io (%
)
0kB 50kB 150kB 250kB 350kB 450kB
40%
60%
80%
100%
120%
●
●
●
●
Reference: (Exp. V1, V3, V5)SDN loss on m3.large (2−core, V2 compared with V1)SDN loss on m3.xlarge (4−core, V4 compared with V3)SDN loss on m3.2xlarge (8−core, V6 compared with V5)
Decreasing loss with increaseof cores due to a reduction of
CPU contention effects.
(1) SDN deployed on high core machines decreasesperformance down to 80% - 90%.
(2) That is far less than a potential language impact (40% -190%).
Kratzke, N., & Quint, P.-C. (2016). ppbench- A Visualizing Network Benchmark forMicroservices. InProceedings of 6th. International Conference on Cloud Computing and Service Sciences (CLOSER 2016) (Vol. 2, pp. 223–231).
Kratzke, N., & Quint, P.-C. (2015). How toOperate Container Clusters more Efficiently? Some Insights Concerning Containers, Software-Defined-Networks, and theirsometimes Counterintuitive Impact on Network Performance. International Journal On Advances In Networks andServices, 8(3&4), 203–214.
Kratzke, N. (2015). About Microservices, Containers and their Underestimated Impact on Network Performance. In Proceedings ofCLOUD COMPUTING 2015 (6th. International Conference on Cloud Computing, GRIDS and Virtualization) (pp. 165–169).