Schulungsübersicht
Grundlagen des Cloud-Betriebs auf AWS
- Betriebliche Rollen und Verantwortlichkeiten in der Cloud
- AWS-Kontostuktur, Organisationen und Multi-Account-Strategien
- Kernbetriebsdienste: CloudWatch, CloudTrail, AWS Config
Infrastruktur als Code und Bereitstellung
- Prinzipien der IaC und unveränderlichen Infrastrukturen
- Bereitstellung mit Terraform und AWS CloudFormation
- Verwaltung von Zustand, Modulen und Umgebungskonvertierungen
CI/CD und Bereitstellungsstrategien
- Entwurf von CI/CD-Pipelines für cloudbasierte Anwendungen
- Blue/Green-, Canary- und Rolling-Bereitstellungen
- Automatische Rollbacks, Gesundheitschecks und Release-Validierungen
Überwachung, Beobachtbarkeit und Benachrichtigungen
- Metriken, Logs und Traces: Senden, Speichern und Analysieren
- Verwenden von CloudWatch, X-Ray und drittanbieter-Beobachtungswerkzeugen
- Definieren von SLOs/SLIs, Benachrichtigungsrichtlinien und Bereitschaftspraktiken
Sicherheitsbetrieb und Identitätsmanagement
- IAM-Best Practices, kleinstes Prinzip der Berechtigung und Cross-Account-Zugang
- Geheimschutzverwaltung, KMS und sicherer Parameterstores
- Betriebssicherheit: Patch-Strategien, Vulnerabilitätsscanning und Audit Trails
Widerstandsfähigkeit, Backup und Notfallwiederherstellung
- Entwerfen für Fehlertoleranz und hohe Verfügbarkeit
- Backup-Strategien, automatisierte Snapshots und Wiederherstellungsverfahren
- Notfallwiederherstellungsplanning und Runbook-Erstellung
Kostenoptimierung und Governance
- Kostendurchsicht: Abrechnung, Tagging und Kostenzuordnungsstrategien
- Größenanpassung, reservierte Instanzen/Sparpläne und Budgetkontrollen
- Governance: Richtlinien, Schutzmaßnahmen und Automatisierung für Compliance
Container, serverlos und Laufzeitsbetrieb
- Betriebsüberlegungen zu ECS, EKS und Lambda
- Servicediscovery, autoskalieren und Ressourcenbegrenzungen
- Logging, Tracing und Debugging von containerisierten Workloads
Vorfallreaktion, Handbücher und Chaos-Engineering
- Runbookgesteuerte Vorfallreaktion und Post-Mortem-Praktiken
- Automatisierte Fehlerbehebung und Selbstheilungsmuster
- Einführung in Chaos-Experimente zur Validierung der Widerstandsfähigkeit
Praktische Übung: Betrieb einer Beispielworkload
- Bereitstellen einer Beispielanwendung mit IaC und CI/CD-Pipeline
- Implementieren von Überwachung, Benachrichtigungen und einem automatisierten Fehlerbehebungsskript
- Simulieren von Vorfällen und Üben der runbookbasierten Reaktion
Zusammenfassung und Nächste Schritte
Voraussetzungen
- Grundlegendes Verständnis von Cloud-Konzepten und Netzwerken
- Kenntnisse in der Linux-Befehlszeile und Skripten
- Erfahrung mit Quellcodeverwaltung (Git) und grundlegenden CI/CD-Konzepten
Zielgruppe
- Cloud-Betriebsingenieure
- SREs und Plattform-Ingenieure
- DevOps-Ingenieure und technische Teamleiter
Erfahrungsberichte (5)
Der Trainer hatte ein gutes Verständnis für die Konzepte
Josheel - Verizon Connect
Kurs - Amazon Redshift
Maschinelle Übersetzung
Der praktische Teil.
Radu - Ness Digital Engineering
Kurs - AWS: A Hands-on Introduction to Cloud Computing
Maschinelle Übersetzung
Der Trainer wusste genau, worüber sie sprachen.
Madumetsa Msomi - BMW
Kurs - AWS DevOps Engineers
Maschinelle Übersetzung
Alles gut, nichts zu verbessern
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Kurs - AWS Lambda for Developers
Maschinelle Übersetzung
IOT-Anwendungen
Palaniswamy Suresh Kumar - Makers' Academy
Kurs - Industrial Training IoT (Internet of Things) with Raspberry PI and AWS IoT Core 「4 Hours Remote」
Maschinelle Übersetzung