Management grosser Daten-Netze
Dipl.-Ing. Christoph M. [email protected]
Bitte Mobiltelephone ruhigstellen
Ablauf
• Juni 2004– Vortrag, Diskussion und Fallbeispiele– Kaffeepausen, Mittagsunterbrechung– Ende spätestens 16:00
• Juni 2004– Präsentation der Gruppenarbeiten
Ziel der Veranstaltung
• Einführung in das Netzwerk-Management– Problemstellung– Anwendungsgebiete– Verfahren– Tools– Technische Details nach Bedarf
• Strategische Überlegungen zur Skalierbarkeit von Managementtools und -prozessen
Benotung
• Bis 30. Juli 2004 ca. zwei Seiten technisch detaillierter Aufsatz zu einem Netzwerk-management Thema (noch nicht gezeigtes Tool etc.) per email.
Begriffsdefinition Netzwerk-Management
• Gesamtheit von– Verfahrensweisen– Techniken– Hilfsmitteln
• zur Verwaltung von Daten-Netzwerken
Managementbereiche
OSI
Network
Management
ng
Managementbereiche
Layer 0: Kabelmanagement & ToolsLayer 1: Verkabelungsmanagement & ToolsLayer 2: Gerätemanagement & Tools
cdp, mac-tabellen etc.Layer 3: IP-basiertes Netzwerkmanagement & Tools
SNMP, Rmon etc.Dokumentation für den Störfall
Configuration Management
• Inventur– Hardware– Software
• Verbindungen• Kabelwege• Konfigurationen• Änderungsmanagement
(Change Control)
Configuration Management
• Hardware– Genauer Ort (Raum, Stockwerk, Schrank, HE usw.)– Seriennummern– Datum der Anschaffung/Inbetriebnahme– Garantie/Wartungsfristen– Service-Level, Service-Partner– Konfigurationsbeschreibung (Modul x in Slot y von
Gerät z)
Configuration Management
• Software– Seriennummern, Lizenschlüssel– Datum der Anschaffung/Inbetriebnahme– Garantie/Wartungsfristen (updateservice)– Service-Level, Service-Partner (bugfix)– Parametrisierung (Adressen, alles, das zur
Rekonstruktion benötigt wird)
Configuration Management
• Verbindungen– Genaue Bezeichnung des Anschlusses– Welches Interface wird damit mit welchem Gerät
verbunden?– Link-Geschwindigkeit, Duplex etc.– Service-Level (hochkritisch oder unkritisch etc.)– Ausführende Person, Datum der Anschaltung– Kostenstelle zur Verrechnung
Configuration Management
• Kabelwege– Genauer Ort der Netzwerkanschlüsse– Genauer Ort der Patchfelder– Verlauf des Kabels (z.B. Microstation-Plan)– Meßprotokolle, Abnahmedokumentation– Kabellängen– Verwendete Stecker– Patchungen
Configuration Management
• Konfigurationen– Parametrisierung
• Adressen, • alles, das zur Rekonstruktion benötigt wird
– Benutzernamen/Passwörter– SNMP Communities– Trap-destinations– Syslogserver
Configuration Management
• Change Management– Wichtigster Prozess in der IT!– Wer ist wann wie und wie lange betroffen– Notfallplan, wenn etwas schief geht– Verständigungsliste– Beteiligtenliste– Durchführungsplan– „Checkpoints“– Kriterien zur Feststellung des Erfolges
Fault Management
• Meldungen (Events)• Alarmmeldungen (Alarms)• Problem Identifikation• Problem-Behebung (Troubleshooting)• Problem-Lösung (Solving)• Fehlerdokumentation (Fault Logging)
Fault Management
• Meldungen (Events)– Nachrichten über ein Ereignis, das keine unmittelbar
Sytemgefahr darstellt• Port up/down• Tür auf/zu• Speicherplatz zu 85% gefüllt ...
– Protkollierung und Analyse notwendig• Kann die Vorzeichen eines crashes ankündigen
Fault Management
• Alarm-Meldungen (Alarms)– Nachrichten über ein Ereignis, das eine unmittelbar
Sytemgefahr darstellt• Power failure• Uplink down• Speicherplatz zu 100% gefüllt ...
– Protkollierung und Analyse notwendig– Meist unmittelbarer Handlungsbedarf– Benachrichtigung der Bereitschaft
Fault Management
• Benachrichtigung der Bereitschaft– Klassifizierung des Ereignisses und Verständigung der
zuständigen Personen– Rückmeldung, ob die Verständigung angekommen ist– Eskalationsverfahren bei Problempersistenz– Benachrichtigungswege eher „outbound“, d.h.
unabhängig vom überwachten System.• SMS• Voice-mail• e-mail ?
Fault Management
• Problem-Identifikation– Oft komplexe Wirkzusammenhänge– Wenig Automatisationsunterstützung– Gute Dokumentation notwendig
• Wieder „outbound“, z.B. CD, Papier• Graphische Darstellung des Netzwerkes
– Information über letzte Änderungen– Hohes Maß an Erfahrung notwendig
Fault Management
• Problem-Behebung– (vorübergehende) Maßnahme zur Beseitigung der
Problemauswirkung.– „Workaround“, Q&D etc.
• z.B. Flugkabel, andere Software ...– Ziel ist, ein zumindest teilweise funktionsfähiges
System bis zum nächsten Wartungsfenster zu haben.– Unbedingt dokumentieren– Aus dem Provisorium darf kein Dauerzustand werden!
Fault Management
• Problem-Lösung– Maßnahme zur nachhaltigen Beseitigung des Problems– Beseitigung der Ursachen– Maßnahmen, um eine Wiederholung zu verhindern– Dokumentation in Wissensdatenbank
• Evtl. Nachschulungen– Überprüfung, ob ähnliche Szenarien drohen
Fault Management
• Fehlerdokumentation (fault logging)– Jeder Fehler (auch wenn er durch die Technik
automatisch korrigiert wurde) muß dokumentiert und analysiert werden
– Trendanalyse• z.B. Unsere 3 Jahre alten GBIC gehen vermehrt
kaputt– Fehlerprevention
• Ältere GIBC vorsorglich tauschen
Performance Management
• Verfügbarkeit (Availability)• Antwortzeiten (Response time)• Durchsatz (Throughput)• Nutzung (Utilisation)• Kapazitätsplanung (Capacity)
Performance Management
• Verfügbarkeit (Availability)– % der Zeit, die das System während der vereinbarten
Betriebszeiten zu den vereinbarten Bedingungen arbeitete
– Basis der Dienstgütevereinbarung (Service Level)– Messung muß mit dem Kunden vereinbart werden
• Welche Parameter werden wo gemessen• Gemeinsame Übereinkunft über die
Problemursachen (z.B. DAU)
Performance Management
• Antwortzeiten (Response time)– Zeit, die eine Anwendung vom Userinput bis zur
Reaktion benötigt– Meist nicht durch das Netz verursacht
• Delay kann sich aufsummieren– Basis der Dienstgütevereinbarung (Service Level)– Messung muß mit dem Kunden vereinbart werden
• Welche Parameter werden wo gemessen• Gemeinsame Übereinkunft über die
Problemursachen (z.B. DAU)
Performance Management
• Durchsatz (Throughput)– (Korrekt) übertragene Datenmenge pro Zeiteinheit
• „Goodput“• Datenverlust (z.B. Hardwaredefekt) verursacht
massive Verzögerungen– Basis der Dienstgütevereinbarung (Service Level)– Messung muß mit dem Kunden vereinbart werden
• Welche Parameter werden wo gemessen– Eigene „probes“ an typischen Stellen installieren
Performance Management
• Nutzung (Utilisation)– Basis der Kapazitätsplanung– Typische Szenarien– Basis für Traffic Engineering Maßnamen– Absolut und in % der maximal verfügbaren Bandbreite
Performance Management
• Kapazitätsplanung (Capacity)– Trend Analyse– Ursachenforschung der Entwicklung– Vorhersage der weiteren Entwicklung– Maßnahmen zur Anpassung der Kapazitäten
• z.B. traffic-engineering• Hardware upgrade
Accounting Management
• Investitions-Sicherung• Kostenüberwachung• Nutzungsverrechnung• Kostenverrechnung
Security Management
• Allemeine Richtlinien (Policy)• Befugnisse (Authority)• Zugriffs-Ebenen (Access Level)• Protkollierung (Logging)• Regelverstösse (Exceptions)
– Anmeldefehler (Authentication failure)– Intrusion detection
Strategische Überlegungen
• Skalierbarkeit von Managementtools und -prozessen– Verteilung/Speicherung der Dokumentation– Verständigungsverfahren– Out-tasking– Bereitschaftsregelungen
SNMP
• Simple Network Management Protocol• UDP (!)• Aktuell SNMPv3 (Draft RFC 2271-2275), noch
nicht verbreitet– Authentisierung (MD5)– Verschlüsselung (DES)– Klassenbildung
• OSI CMIP
SNMP
• Agent (im Device)• Manager (zentrales tool)• MIB Management Information Base
– Öffentlicher und privater Teil– Baumstruktur
• Numerisch / Mnemonics• Traps
SNMP RFCs =>> RTFM
• RFC 1067 - A Simple Network Management Protocol
• RFC 1089 - SNMP over Ethernet
• RFC 1140 - IAB Official Protocol Standards
• RFC 1147 - Tools for Monitoring and Debugging TCP/IP Internets and Interconnected Devices [superceded by RFC 1470]
• RFC 1155 - Structure and Identification of Management Information for TCP/IP based internets.
• RFC 1156 (H)- Management Information Base Network Management of TCP/IP based internets
• RFC 1157 - A Simple Network Managment Protocol
• RFC 1158 - Management Information Base Network Management of TCP/IP based internets: MIB-II
• RFC 1161 (H)- SNMP over OSI
• RFC 1187 - Bulk Table Retrieval with the SNMP
• RFC 1212 - Concise MIB Definitions
• RFC 1213 - Management Information Base for Network Management of TCP/IP-based internets: MIB-II
• RFC 1215 (I)- A Convention for Defining Traps for use with the SNMP
• RFC 1224 - Techniques for Managing Asynchronously-Generated Alerts
• RFC 1270 (I)- SNMP Communication Services
• RFC 1303 (I)- A Convention for Describing SNMP-based Agents
• RFC 1470 (I)- A Network Management Tool Catalog
• RFC 1298 - SNMP over IPX (obsolete, see RFC 1420)
• RFC 1418 - SNMP over OSI
• RFC 1419 - SNMP over AppleTalk
• RFC 1420 - SNMP over IPX (replaces RFC 1298)
RMON
• Remote Monitor (RFC 1271, 1573)• Neun Gruppen
– Statistik– History– Host – Host top n– Matrix– Alarms– Events– Filter– Capture
Tools
• What´s up gold• Orion Network Performance Monitor• Logalot• Denika• NetHealth• C6000• Cisco Works• Epi-Center• ForeView
Tools
• Tivoli– Netview
• MRTG• Loriot• SNAG-View 1.2• Remedy
C6000
C6000
C6000
Cisco-Works
links
• Hardware– http://www.cisco.com/
– http://www.extremenetworks.com/
– http://www.foundrynet.com/
• Kabel– http://www.kerpen.com/
– http://www.daetwyler.de/
– http://www.osi-fiber.de/
links
• tools– http://www.mrtg.org/
– http://www.fnt.de/
– http://www.oasys-software.com/
• traffic-shaper– http://bandwidtharbitrator.com/– http://www.sitaranetworks.com/– http://www.peribit.com/
Management grosser Daten-Netze
Dipl.-Ing. Christoph M. [email protected]