Schulungsübersicht
Einführung
Installieren und Konfigurieren von Dataiku Data Science Studio (DSS)
- Systemanforderungen für Dataiku DSS
- Einrichten von Apache Hadoop und Apache Spark Integrationen
- Konfigurieren von Dataiku DSS mit Web-Proxies
- Migrieren von anderen Plattformen zu Dataiku DSS
Überblick über die Funktionen und Architektur von Dataiku DSS
- Grundlegende Objekte und Diagramme in Dataiku DSS
- Was ist ein Rezept in Dataiku DSS?
- Arten von Datensätzen, die von Dataiku DSS unterstützt werden
Ein Dataiku DSS-Projekt erstellen
Definieren von Datensätzen zur Verbindung mit Datenressourcen in Dataiku DSS
- Arbeiten mit DSS-Konnektoren und Dateiformaten
- Standard-DSS-Formate vs. Hadoop-spezifische Formate
- Hochladen von Dateien für ein Dataiku-DSS-Projekt
Übersicht über das Server-Dateisystem in Dataiku DSS
Erstellen und Verwenden von verwalteten Ordnern
- Dataiku DSS-Rezept für Zusammenführungsordner
- Lokale vs. nicht-lokale verwaltete Ordner
Aufbau eines Dateisystem-Datensatzes mit verwalteten Ordnerinhalten
- Durchführung von Bereinigungen mit einem DSS-Code-Rezept
Arbeiten mit Metrik-Datensatz und internem Statistik-Datensatz
Implementierung des DSS-Download-Rezepts für HTTP-Datensätze
Verlagerung von SQL-Datensätzen und HDFS-Datensätzen mit DSS
Datensätze in Dataiku DSS bestellen
- Writer-Bestellung vs. Lesezeit-Bestellung
Erkundung und Vorbereitung von Datenvisualisierungen für ein Dataiku DSS-Projekt
Überblick über Dataiku-Schemata, Speichertypen und Bedeutungen
Durchführen von Skripten zur Datenbereinigung, Normalisierung und Anreicherung in Dataiku DSS
Arbeiten mit Dataiku DSS Charts Interface und Arten von visuellen Aggregationen
Nutzung der interaktiven Statistics Funktion von DSS
- Univariate Analyse vs. bivariate Analyse
- Verwendung des DSS-Tools Hauptkomponentenanalyse (PCA)
Überblick über Machine Learning mit Dataiku DSS
- Überwachte ML vs. unüberwachte ML
- Referenzen für DSS ML Algorithmen und Handhabung von Merkmalen
- Deep Learning mit Dataiku DSS
Überblick über den aus den DSS-Datensätzen und -Rezepten abgeleiteten Fluss
Umwandlung bestehender Datensätze in DSS mit visuellen Rezepten
Verwendung von DSS-Rezepten auf der Grundlage von benutzerdefiniertem Code
Optimierung der Code-Exploration und des Experimentierens mit DSS Code Notebooks
Schreiben von erweiterten DSS-Visualisierungen und benutzerdefinierten Frontend-Funktionen mit Webapps
Arbeiten mit Dataiku DSS Code Reports Funktion
Gemeinsame Nutzung des Datenprojekts Elements und Vertrautmachen mit dem DSS-Dashboard
Entwerfen und Verpacken eines Dataiku DSS-Projekts als wiederverwendbare Anwendung
Überblick über die erweiterten Methoden in Dataiku DSS
- Implementierung einer optimierten Partitionierung von Datensätzen mit DSS
- Ausführung von spezifischen DSS-Verarbeitungsteilen durch Berechnungen in Kubernetes-Containern
Überblick über Collaboration und Versionskontrolle in Dataiku DSS
Implementierung von Automatisierungsszenarien, Metriken und Prüfungen für DSS-Projekttests
Bereitstellen und Aktualisieren eines Projekts mit dem DSS-Automatisierungsknoten und Bundles
Arbeiten mit Real-Time APIs in Dataiku DSS
- Zusätzliche APIs und Rest-APIs in DSS
Analysieren und Forecasting Dataiku DSS Zeitreihen
Absicherung eines Projekts in Dataiku DSS
- Verwalten von Projektberechtigungen und Dashboard-Berechtigungen
- Implementierung von erweiterten Sicherheitsoptionen
Integration von Dataiku DSS in die Cloud
Fehlersuche
Zusammenfassung und Schlussfolgerung
Voraussetzungen
- Erfahrungen mit den Programmiersprachen Python, SQL und R
- Grundkenntnisse in der Datenverarbeitung mit Apache Hadoop und Spark
- Verständnis für Konzepte des maschinellen Lernens und Datenmodelle
- Hintergrundwissen in statistischen Analysen und Data-Science-Konzepten
- Erfahrungen mit der Visualisierung und Kommunikation von Daten
Publikum
- Ingenieure
- Datenwissenschaftler
- Datenanalysten