Schulungsübersicht
Grundlagen des Data-Warehousing
- Zweck, Komponenten und Architektur der Warehouse
- Datamarts, Unternehmenswarehouses und Lakehouse-Muster
Dimensionsmodellierung
- Tatsachen, Dimensionen und Granularität
- Sternschema im Vergleich zum Schneeflockenschema
- Arten von langsam sich verändernden Dimensionen und deren Handhabung
ETL- und ELT-Prozesse
- Austrittsstrategien aus OLTP und APIs
- Transformation, Datenaufbereitung und Konformität
- Ladekonzepte, Orchestrierung und Abhängigkeitsmanagement
Datenqualität und Metadatengestion
- Datenprofilierung und Validierungsregeln
- Ausrichtung von Master- und Referenzdaten
- Vorherrschaft, Kataloge und Dokumentation
Analytics und Leistung
- Kubieren-Konzepte, Aggregationen und materialisierte Sichten
- Aufteilung, Clustering und Indexierung für Analytics
- Arbeitslastmanagement, Zwischenspeicherung und Abfragemessung
Sicherheit und Governance
- Zugriffskontrolle, Rollen und Zeilenstufe-Sicherheit
- Konformitätsaspekte und Prüfung
- Backup, Wiederherstellung und Zuverlässigkeitspraktiken
Moderne Architekturen
- Cloud Data-Warehouses und Elastizität
- Streaming-Ingestion und nahezu Echtzeit-Analytics
- Kostenoptimierung und Überwachung
Kapstone: Von der Quelle zum Sternschema
- Modellierung eines Geschäftsprozesses in Tatsachen und Dimensionen
- Aufbau eines end-to-end ETL- oder ELT-Ablaufs
- Veröffentlichung von Dashboards und Validierung von Metriken
Zusammenfassung und weitere Schritte
Voraussetzungen
- Eine Verständnis von relationalen Datenbanken und SQL
- Erfahrung im Bereich Datenanalyse oder -berichterstattung
- Basiskenntnisse in Cloud- oder On-Premises-Dataplattformen
Zielgruppe
- Datenanalysten, die sich dem Data-Warehousing zuwenden
- BI-Entwickler und ETL-Ingenieure
- Datenarchitekten und Teamleiter
Erfahrungsberichte (5)
Die Live-Beispiele
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung
sehr interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maschinelle Übersetzung
Genügend praktische Umsetzung, der Trainer ist kompetent
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maschinelle Übersetzung
Lernen Sie Spark Streaming, Databricks und AWS Redshift kennen
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maschinelle Übersetzung
Übungsaufgaben
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maschinelle Übersetzung