Data Vault: Building a Scalable Data Warehouse Schulung
Data Vault Die Modellierung ist eine Datenbankmodellierungstechnik, die eine langfristige historische Speicherung von Daten ermöglicht, die aus verschiedenen Quellen stammen. Ein Datentresor speichert eine einzige Version der Fakten oder "alle Daten, die ganze Zeit". Sein flexibles, skalierbares, konsistentes und anpassungsfähiges Design umfasst die besten Aspekte der 3. Normalform (3NF) und des Sternschemas.
In dieser von einem Trainer geleiteten Live-Schulung lernen die Teilnehmer, wie man ein Data Vault erstellt.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- die Architektur und die Designkonzepte hinter Data Vault 2.0 und seine Interaktion mit Big Data, NoSQL und AI zu verstehen.
- Data Vaulting-Techniken anwenden, um Auditing, Tracing und Inspektion von historischen Daten in einem Data Warehouse zu ermöglichen.
- Entwicklung eines konsistenten und wiederholbaren ETL-Prozesses (Extract, Transform, Load).
- Aufbau und Bereitstellung hoch skalierbarer und wiederholbarer Warehouses.
Format des Kurses
- Teilweise Vorlesung, teilweise Diskussion, Übungen und umfangreiche praktische Übungen
Schulungsübersicht
Einführung
- Die Unzulänglichkeiten bestehender Data-Warehouse-Datenmodellierungsarchitekturen
- Vorteile der Data Vault-Modellierung
Überblick über die Data Vault-Architektur und Designprinzipien
- SEI / CMM / Konformität
Data Vault-Anwendungen
- Dynamisches Data Warehousing
- Exploration Warehousing
- In-Database Data Mining
- Schnelle Verknüpfung von externen Informationen
Data Vault Komponenten
- Knotenpunkte, Links, Satelliten
Aufbau eines Data Vault
Modellierung von Hubs, Links und Satelliten
Data Vault Referenzregeln
Wie Komponenten miteinander interagieren
Modellierung und Befüllung eines Data Vault
Umwandlung von 3NF OLTP in ein Data Vault Enterprise Data Warehouse (EDW)
Verstehen von Ladedaten, Enddaten und Join-Operationen
Business Schlüssel, Beziehungen, Verknüpfungstabellen und Verknüpfungstechniken
Abfragetechniken
Lastverarbeitung und Abfrageverarbeitung
Überblick über die Matrix Methodik
Abrufen von Daten in Datenentitäten
Laden von Hub-Entitäten
Laden von Link-Entitäten
Laden von Satelliten
Verwendung von SEI/CMM Level 5 Vorlagen, um wiederholbare, zuverlässige und quantifizierbare Ergebnisse zu erhalten
Entwicklung eines konsistenten und wiederholbaren ETL-Prozesses (Extrahieren, Transformieren, Laden)
Aufbau und Bereitstellung hoch skalierbarer und wiederholbarer Warehouses
Schlussbemerkungen
Voraussetzungen
- Verständnis von Data-Warehousing-Konzepten
- Verständnis von Datenbank- und Datenmodellierungskonzepten
Zielgruppe
- Datenmodellierer
- Data-Warehousing-Spezialisten
- (0) Intelligenz-Spezialisten
- Daten-Ingenieure
- Database Administratoren
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.
Data Vault: Building a Scalable Data Warehouse Schulung - Booking
Data Vault: Building a Scalable Data Warehouse Schulung - Enquiry
Data Vault: Building a Scalable Data Warehouse - Beratungsanfrage
Beratungsanfrage
Erfahrungsberichte (1)
wie der Trainer sein Wissen im Unterrichtsthema zeigt
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Kurs - Data Vault: Building a Scalable Data Warehouse
Maschinelle Übersetzung
Kommende Kurse
Kombinierte Kurse
Cluster Analysis with R and SAS
14 StundenDiese Live-Schulung unter Anleitung (online oder vor Ort) richtet sich an Datenanalysten, die mit R in SAS für Clusteranalysen programmieren möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Nutzen Sie die Clusteranalyse für die Datengewinnung
- Beherrschen Sie die R-Syntax für Clustering-Lösungen.
- Hierarchisches und nicht-hierarchisches Clustering implementieren.
- Datengestützte Entscheidungen treffen, um die Geschäftsabläufe zu verbessern.
From Data to Decision with Big Data and Predictive Analytics
21 StundenPublikum
Wenn Sie versuchen, aus den Daten, auf die Sie Zugriff haben, einen Sinn zu machen, oder wenn Sie unstrukturierte Daten analysieren möchten, die im Internet verfügbar sind (z. B. Twitter, Linked in usw.), ist dieser Kurs für Sie.
Es richtet sich hauptsächlich an Entscheidungsträger und Personen, die entscheiden müssen, welche Daten gesammelt und welche analysiert werden sollten.
Es richtet sich nicht an Personen, die die Lösung konfigurieren. Diese Personen werden jedoch vom Gesamtüberblick profitieren.
Lieferungsmodus
Während des Kurses werden den Teilnehmern Arbeitsbeispiele von meist Open Source-Technologien vorgestellt.
Auf kurze Vorträge folgen Präsentationen und einfache Übungen der Teilnehmer
Inhalt und verwendete Software
Die gesamte verwendete Software wird jedes Mal aktualisiert, wenn der Kurs ausgeführt wird. Wir überprüfen daher die neuesten Versionen.
Es umfasst den Prozess vom Abrufen, Formatieren, Verarbeiten und Analysieren der Daten, um zu erklären, wie der Entscheidungsprozess mit maschinellem Lernen automatisiert werden kann.
Data Mining and Analysis
28 StundenZielsetzung:
Die Teilnehmer sind in der Lage, große Datensätze zu analysieren, Muster zu extrahieren und die richtigen Variablen auszuwählen, die sich auf die Ergebnisse auswirken, so dass ein neues Modell mit prädiktiven Ergebnissen prognostiziert werden kann.
Data Mining
21 StundenDer Kurs kann mit allen Tools bereitgestellt werden, einschließlich kostenloser Open-Source-Data-Mining-Software und Anwendungen
Data Mining with Python
14 StundenDiese Live-Schulung (vor Ort oder per Fernzugriff) richtet sich an Datenanalysten und Datenwissenschaftler, die fortgeschrittenere Datenanalysetechniken für das Data Mining mit Python implementieren möchten.
Am Ende dieser Schulung können die Teilnehmer:
- Wichtige Bereiche des Data Mining verstehen, einschließlich Assoziationsregel-Mining, Textstimmungsanalyse, automatische Textzusammenfassung und Erkennung von Datenanomalien.
- Verschiedene Strategien zur Lösung realer Data-Mining-Probleme vergleichen und implementieren.
- Die Ergebnisse verstehen und interpretieren.
Format des Kurses
- Interaktiver Vortrag und Diskussion.
- Viele Übungen und praktische Anwendungen.
- Praktische Umsetzung in einer Live-Lab-Umgebung.
Anpassungsoptionen für den Kurs
- Um eine individuelle Schulung für diesen Kurs anzufordern, kontaktieren Sie uns bitte, um eine Vereinbarung zu treffen.
Data Mining with R
14 StundenR ist eine freie Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Anzahl von Managern und Datenanalysten in Unternehmen und Hochschulen verwendet. R bietet eine Vielzahl von Paketen für das Data Mining.
Data Visualization
28 StundenDieser Kurs richtet sich an Ingenieure und Entscheidungsträger, die im Bereich Data Mining und Knowledge Discovery arbeiten.
Sie lernen, wie Sie effektive Diagramme erstellen und Ihre Daten so präsentieren und darstellen, dass sie die Entscheidungsträger ansprechen und ihnen helfen, verborgene Informationen zu verstehen.
Data Mining with Excel
14 StundenDiese von einem Dozenten geleitete Live-Schulung (online oder vor Ort) richtet sich an Datenwissenschaftler, die Excel für Data Mining verwenden möchten.
- Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
- Daten mit Excel zu erforschen, um Data Mining und Analysen durchzuführen.
- Algorithmen für Data Mining Microsoft anwenden.
- Konzepte des Data Mining in Excel verstehen.
Data Mining with Weka
14 StundenDiese Live-Schulung in Deutschland (online oder vor Ort) richtet sich an Anfänger und fortgeschrittene Datenanalysten und Datenwissenschaftler, die Weka zur Durchführung von Data-Mining-Aufgaben verwenden möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- Weka zu installieren und zu konfigurieren.
- Die Weka-Umgebung und -Workbench zu verstehen.
- Data-Mining-Aufgaben mit Weka durchzuführen.
Data Mining & Machine Learning with R
14 StundenR ist eine kostenlose Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Zahl von Managern und Datenanalysten in Unternehmen und in der Wissenschaft verwendet. R verfügt über eine Vielzahl von Paketen für Data Mining.
Data Science for Big Data Analytics
35 StundenBig Data sind Datenmengen, die so umfangreich und komplex sind, dass herkömmliche Anwendungssoftware für die Datenverarbeitung nicht ausreicht, um mit ihnen umzugehen. Zu den großen Datenherausforderungen gehören Datenerfassung, Datenspeicherung, Datenanalyse, Suche, Freigabe, Übertragung, Visualisierung, Abfrage, Aktualisierung und Datenschutz.
Foundation R
7 StundenDieser von einem Trainer durchführte Live-Kurs in Deutschland (online oder vor Ort) richtet sich an Anfängerinnen und Anfänger, die eine fundierte Kenntnis der Grundlagen von R und der Arbeit mit Daten erlangen möchten.
Am Ende dieses Kurses werden die TeilnehmerInnen in der Lage sein:
- Das R-Programmierumgebung und die RStudio-Oberfläche zu verstehen.
- Datensätze mithilfe von R-Befehlen und -Paketen einzulesen, zu manipulieren und zu erkunden.
- Einfache statistische Analysen durchzuführen und Daten zusammenzufassen.
- Mithilfe sowohl der Basissyntax von R als auch ggplot2 Visualisierungen zu erstellen.
- Arbeitsumgebungen, Skripte und Pakete effektiv zu verwalten.
KNIME Analytics Platform for BI
21 StundenKNIME Analytics Platform ist eine führende Open-Source-Option für datengetriebene Innovationen. Sie hilft Ihnen dabei, das in Ihren Daten verborgene Potenzial zu entdecken, neue Erkenntnisse zu gewinnen oder neue Zukünfte vorherzusagen. Mit mehr als 1000 Modulen, Hunderten von einsatzbereiten Beispielen, einer umfassenden Palette integrierter Tools und der größten Auswahl an fortschrittlichen Algorithmen ist die KNIME Analytics Platform die perfekte Toolbox für jeden Datenwissenschaftler und Geschäftsanalysten.
Dieser Kurs für die KNIME Analytics-Plattform ist eine ideale Gelegenheit für Anfänger, fortgeschrittene Benutzer und KNIME Experten, um sich mit KNIME zu machen, seine effektivere Verwendung zu erlernen und klare, umfassende Berichte auf der Grundlage von KNIME Workflows zu erstellen
Platforma analityczna KNIME - szkolenie kompleksowe
35 StundenDer Schulungskurs "Analytics Platform KNIME" bietet einen umfassenden Überblick über diese kostenlose Datenanalyseplattform. Das Programm umfasst eine Einführung in die Datenverarbeitung und -analyse, die Installation und Konfiguration KNIME, die Erstellung von Workflows, Geschäftsmodellierungsmethoden und Datenmodellierung. Der Kurs behandelt auch fortgeschrittene Datenanalysewerkzeuge, Import- und Export-Workflows, Toolintegration, ETL-Prozesse, Data Mining, Visualisierung, Erweiterungen und Integrationen mit Tools wie R, Java, Python, Gephi, Neo4j. Abschließend wird auf die Berichterstattung, die Integration mit BIRT und KNIME WebPortal eingegangen.
Oracle SQL Intermediate - Data Extraction
14 StundenZiel des Kurses ist es, die Teilnehmer in die Lage zu versetzen, die Arbeit mit der Sprache SQL in der Datenbank Oracle zur Datenextraktion auf mittlerem Niveau zu beherrschen.