Schulungsübersicht

Einführung in fortgeschrittenes Alerting

  • Grundprinzipien der Alarmierung in IT-Systemen
  • Überblick über Prometheus Alertmanager
  • Alerting-Funktionen in Grafana

Erstellen von erweiterten Alerting-Regeln

  • Definieren von Alerting-Regeln in Prometheus
  • Verwendung von Labels und Kommentaren für Alerts
  • Gruppierungen und Silencing-Strategien

Integration von Alertmanager mit externen Systemen

  • Konfigurieren von Webhooks für externe Integrationen
  • Integration mit Tools wie Slack, PagerDuty und E-Mail-Systemen
  • Anpassen von Alertmanager-Vorlagen

Automatisieren von Antworten auf Alerts

  • Implementieren von automatisierten Abhilfeworkflows
  • Integration mit Orchestrierungstools (z. B. Ansible, Kubernetes)
  • Verwendung von Skripten für die automatisierte Problemlösung

Visualisierung von Alerts in Grafana

  • Einrichten von Alert Panels in Grafana
  • Anpassen von Alert-Benachrichtigungen und Schwellenwerten
  • Bewährte Praktiken zur Überwachung des Warnstatus

Verwaltung von Alerts mit hohem Aufkommen

  • Effektiver Umgang mit Alarmstürmen
  • Optimieren der Prometheus Leistung für Alerting
  • Scala Überlegungen zur Flexibilität von Alertmanager

Skalierung und fortgeschrittene Techniken

  • Verteilte Alerting-Setups mit Prometheus und Alertmanager
  • Integration mit Cloud-basierten Alerting-Lösungen
  • Erforschung neuer Funktionen in den Ökosystemen von Grafana und Prometheus

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Grundlegende Erfahrung mit Grafana und Prometheus
  • Verständnis von IT-Überwachungskonzepten
  • Vertrautheit mit Skripting oder Programmierung zur Automatisierung

Zielgruppe

  • DevOps Ingenieure
  • Ingenieure für Standortzuverlässigkeit (SREs)
 14 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Erfahrungsberichte (2)

Kommende Kurse

Verwandte Kategorien