Schulungsübersicht

Einführung in AIOps mit Open-Source-Tools

  • Überblick über die Konzepte und Vorteile von AIOps
  • Prometheus und Grafana im Observability-Stack
  • Wo ML in AIOps Platz hat: prädiktive vs. reaktive Analytics

Einrichtung von Prometheus und Grafana

  • Installation und Konfiguration von Prometheus für die Erhebung zeitbasierter Datenreihen
  • Erstellen von Dashboards in Grafana mit Echtzeitmetriken
  • Untersuchen von Exportern, Relabeling und Dienstentdeckung

Datenvorverarbeitung für ML

  • Auswählen und Transformieren von Prometheus-Metriken
  • Vorbereiten von Datensätzen für Anomaliedetektion und Vorhersage
  • Verwendung der Transformationen in Grafana oder Pipeline in Python

Anwendungsfall Machine Learning zur Anomaliedetektion

  • Grundlegende ML-Modelle für Ausreißererkennung (z.B. Isolation Forest, One-Class SVM)
  • Training und Bewertung von Modellen auf Zeitreihendaten
  • Visualisieren von Anomalien in Grafana-Dashboards

Forecasting Metriken mit ML

  • Erstellen einfacher Vorhersagemodelle (ARIMA, Prophet, Einführung in LSTM)
  • Vorhersage von Systemlast oder Ressourcenverwendung
  • Verwenden von Vorhersagen für frühe Warnungen und Skalierungsfälle

Integrieren von ML mit Alerting und Automatisierung

  • Definieren von Alarmregeln basierend auf ML-Ausgabe oder Schwellenwerten
  • Verwendung von Alertmanager und Benachrichtigungsrouting
  • Auslösen von Skripten oder Automatisierungsworfkflows bei Anomalieerkennung

Skalieren und Operationalisieren von AIOps

  • Integrieren externer Observability-Tools (z.B. ELK Stack, Moogsoft, Dynatrace)
  • Operationalisierung von ML-Modellen in Observability-Pipelines
  • Best Practices für AIOps bei Skalierung

Zusammenfassung und weitere Schritte

Voraussetzungen

  • Ein Verständnis von Systemüberwachung und Observability-Konzepten
  • Erfahrung mit Grafana oder Prometheus
  • Vertrautheit mit Python und den Grundprinzipien der Maschinellem Lernen

Zielgruppe

  • Observability-Engineer
  • Infrastrukturteams und DevOps-Teams
  • Architekten von Überwachungsplattformen und Site Reliability Engineers (SREs)
 14 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Kommende Kurse

Verwandte Kategorien


Fatal error: Uncaught TypeError: _isl_get_excluded_site(): Return value must be of type ?array, none returned in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc:38 Stack trace: #0 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(30): _isl_get_excluded_site() #1 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(17): isl_get_excluded_site() #2 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(51): get_outline_isls() #3 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(7): islc_prepare_links() #4 /apps/hitra7/npfrontend/nptemplates/default.php(272): islc7_sites_links_array_v3() #5 /apps/hitra7/npfrontend/modules/course/course.php(143): require_once('...') #6 /apps/hitra7/npfrontend/core/routes.php(15): course_menu_callback() #7 /apps/hitra7/npfrontend/__index.php(81): require_once('...') #8 /apps/hitra7/npfrontend/index.php(15): include_once('...') #9 /apps/hitra7/index.php(66): include_once('...') #10 {main} thrown in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc on line 38