Schulungsübersicht
Einführung
- Wie SRE traditionelle IT und Softwareentwicklung verbindet.
- Die Notwendigkeit von Automatisierung und Beobachtbarkeit.
- Die Rolle von Software-Entwicklern im Vergleich zu Systemadministratoren.
- Site Reliability Engineers vs. DevOps-Ingenieure.
Übersicht eines IT-Systems
- Systemarchitektur, lokal und in der Cloud.
Übersicht über SRE-Prinzipien und -Praktiken
- Infrastruktur als Code.
- Die Rolle von Containerisierung und Orchestrierung (Docker, Kubernetes usw.).
- Continuous Integration, Continuous Deployment und Continuous Delivery.
- Beobachtbarkeit.
Evaluierung eines IT-Systems
- Bestandsaufnahme der Team- und organisatorischen Ressourcen.
- Abbildung der Systeme und Prozesse.
- Schätzung des potenziellen Einflusses von SRE.
- Die Rolle des Software-Engineering-Teams.
- Die Rolle des Betriebsteams.
- Die Rolle der Führungskräfte.
Aufrechterhaltung der Zuverlässigkeit eines Systems
- Beschreibung und Messung der gewünschten Zuverlässigkeit eines Dienstes.
- Verständnis von Service Level Objectives (SLOs).
- Verständnis von Service Level Indicators (SLIs) und Service Level Agreements (SLAs).
- Arbeit mit Fehlerbudgets.
- Entwicklung eines SLOs.
Optimierung der Systemadministration
- Einrichten einer Entwicklungs Umgebung.
- Evaluierung von SRE-Werkzeugen.
- Priorisieren von Aufgaben für die Automatisierung.
- Software schreiben.
Bereitstellung von "Infrastruktur als Code"
- Testen und Iterieren von Code.
- Ein System fehlertolerant machen.
- Aus Fehlern lernen.
Überwachung eines Systems
- Beobachtung der Systemleistung.
- SRE-Werkzeuge und -Techniken.
Die Zukunft des SRE
Zusammenfassung und Fazit
Voraussetzungen
- Allgemeine Kenntnisse der IT-Infrastruktur.
- Allgemeines Verständnis des Softwareentwicklungsprozesses.
- Programmier- oder Skripterfahrung in einer beliebigen Sprache.
Zielgruppe
- Entwickler
- Systemadministratoren
- Software-Architekten
- DevOps-Ingenieure
- IT-Manager
Erfahrungsberichte (7)
How detailed subjects are explained with real world examples
Brian Hlabane - African Bank
Kurs - Site Reliability Engineering (SRE) Fundamentals
She is expert in area and provide really nice training. Material, training was really mix of examples , discussion and
Peter Tutka - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Kurs - Site Reliability Engineering (SRE) Fundamentals
View on the SRE/ DevOps from more business/ theoretical point of view. Most helpful for people who already have the practical view.
Michael Varhol - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Kurs - Site Reliability Engineering (SRE) Fundamentals
Approach of the training to send questionnaire before the training, so the training was planned accordingly to expectations. Brings the participants more active.
Stefan Girman - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Kurs - Site Reliability Engineering (SRE) Fundamentals
Sticking to the initial survey from attendees about what should be the focus of training.
Denis Majorsky - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Kurs - Site Reliability Engineering (SRE) Fundamentals
discussions , SRE definition
Daniel Horvath - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Kurs - Site Reliability Engineering (SRE) Fundamentals
Concept of the training, keeping the people focused by asking them a questions and triggering discussions. Also group breakout sessions were great to think about things in groups and see different outcomes from other group.