Schulungsübersicht

Entwurf einer offenen AIOps-Architektur

  • Überblick über die wesentlichen Komponenten in offenen AIOps-Pipelines
  • Datenfluss von der Erfassung bis zur Warnmeldung
  • Werkzeugvergleich und Integrationsstrategie

Datenerfassung und -aggregation

  • Erfassen zeitlicher Daten mit Prometheus
  • Erfassen von Protokollen mit Logstash und Beats
  • Normalisierung der Daten für die Quervergleichung

Erstellen von Observability-Dashboards

  • Visualisieren von Metriken mit Grafana
  • Erstellen von Kibana-Dashboards für Log-Analysen
  • Verwenden von Elasticsearch-Abfragen zur Extraktion operativer Einsichten

Anomalieerkennung und Vorhersage von Ereignissen

  • Exportieren der Observability-Daten in Python-Pipelines
  • Training von ML-Modellen zur Ausreißererkennung und -Vorhersage
  • Bereitstellen von Modellen für die Echtzeit-Inferenz in der Observability-Pipeline

Warnmeldungen und Automatisierung mit offenen Werkzeugen

  • Erstellen von Prometheus-Warnregeln und Routing durch Alertmanager
  • Auslösen von Skripten oder API-Workflows für die automatische Reaktion
  • Verwenden von offenen Orchestrierungstools (z. B., Ansible, Rundeck)

Überlegungen zur Integration und Skalierung

  • Umgang mit Hochvolumeneingaben und Langzeitretention
  • Sicherheit und Zugriffskontrolle in Open-Source-Stacks
  • Skalierung jeder Schicht unabhängig voneinander: Erfassung, Verarbeitung, Warnmeldungen

Reale Anwendungen und Erweiterungen

  • Fallstudien: Leistungsoptimierung, Downtime-Vorbeugung und Kostenoptimierung
  • Erweitern von Pipelines mit Tracing-Tools oder Dienstgraphen
  • Best Practices für das Betreiben und Warten von AIOps in der Produktion

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Erfahrung mit Beobachtungstools wie Prometheus oder ELK
  • Grundlegendes Wissen über Python und Maschinelles Lernen
  • Verständnis von IT-Operationen und Warnungsworkflows

Zielgruppe

  • Fortgeschrittene Site Reliability Engineers (SREs)
  • Dateningenieure in der Operationsabteilung
  • DevOps Plattenvorsitzende und Infrastrukturarchitekten
 14 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Kommende Kurse

Verwandte Kategorien


Fatal error: Uncaught TypeError: _isl_get_excluded_site(): Return value must be of type ?array, none returned in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc:38 Stack trace: #0 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(30): _isl_get_excluded_site() #1 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(17): isl_get_excluded_site() #2 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(51): get_outline_isls() #3 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(7): islc_prepare_links() #4 /apps/hitra7/npfrontend/nptemplates/default.php(272): islc7_sites_links_array_v3() #5 /apps/hitra7/npfrontend/modules/course/course.php(143): require_once('...') #6 /apps/hitra7/npfrontend/core/routes.php(15): course_menu_callback() #7 /apps/hitra7/npfrontend/__index.php(81): require_once('...') #8 /apps/hitra7/npfrontend/index.php(15): include_once('...') #9 /apps/hitra7/index.php(66): include_once('...') #10 {main} thrown in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc on line 38