Schulungsübersicht

Einführung in die fortgeschrittene Alarmierung

  • Grundprinzipien der Alarmierung in IT-Systemen
  • Übersicht über den Prometheus Alertmanager
  • Alarmierungsleistungen in Grafana

Erstellen fortgeschrittener Alarmierungsregeln

  • Definieren von Alarmierungsregeln in Prometheus
  • Verwenden von Labels und Anmerkungen für Alarmsituationen
  • Gruppierung und Stillschweige-Strategien

Integrieren des Alertmanagers mit externen Systemen

  • Konfigurieren von Webhooks für externe Integrationen
  • Integrieren mit Tools wie Slack, PagerDuty und E-Mail-Systemen
  • Anpassen von Alertmanager-Vorlagen

Automatisieren von Reaktionen auf Alarme

  • Implementieren automatisierter Remediation-Workflows
  • Integrieren mit Orchestrierungstools (z.B. Ansible, Kubernetes)
  • Verwenden von Skripten für die automatisierte Fehlerbehebung

Visualisieren von Alarmen in Grafana

  • Einrichten von Alarmsituationen-Panel in Grafana
  • Anpassen von Alarmbenachrichtigungen und Schwellwerten
  • Best Practices für die Überwachung des Alarmsituationen-Status

Verwalten von hochvolumigen Alarmen

  • Effektiv mit Alarmstürmen umgehen
  • Optimieren der Prometheus-Leistung für die Alarmierung
  • Skalierbarkeitsaspekte des Alertmanagers

Skalieren und fortgeschrittene Techniken

  • Verteilte Alarmierungs-Setups mit Prometheus und Alertmanager
  • Integrieren von cloudbasierten Alarmierungslösungen
  • Erkunden neuer Funktionen in den Ökosystemen von Grafana und Prometheus

Zusammenfassung und weitere Schritte

Voraussetzungen

  • Grundlegende Erfahrung mit Grafana und Prometheus
  • Verständnis von IT-Monitoring-Konzepten
  • Kenntnisse in Skript- oder Programmierung für die Automatisierung

Zielgruppe

  • DevOps-Ingenieure
  • Site-Reliability-Engineer (SREs)
 14 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (2)

Kommende Kurse

Verwandte Kategorien