Schulungsübersicht
Kapitel 1: Data Management in HDFS
- Verschiedene Datenformate (JSON / Avro / Parquet)
- Kompressionsverfahren
- Datenschutzmaskierung
- Labore: Analyse verschiedener Datenformate; Aktivieren von Kompression
Kapitel 2: Erweiterte Pig-Verwendung
- Nutzerdefinierte Funktionen
- Einführung in Pig-Bibliotheken (ElephantBird / Data-Fu)
- Einladen komplexer strukturierter Daten mit Pig
- Pig-Optimierung
- Labore: Erweitertes Pig-Skripting, Parsen von komplexen Datentypen
Kapitel 3 : Erweiterte Hive
- Nutzerdefinierte Funktionen
- Verkompensierte Tabellen
- Hive-Leistungsoptimierung
- Labore: Erstellen von verkompensierten Tabellen, Auswerten von Tabellenformaten und Konfiguration
Kapitel 4 : Erweiterte HBase-Verwendung
- Erweitertes Schemamodellieren
- Kompression
- Masseingabe von Daten
- Vergleich breiter und tiefer Tabellen
- HBase und Pig
- HBase und Hive
- Leistungsoptimierung für HBase
- Labore: Optimieren von HBase; Zugriff auf HBase-Daten aus Pig & Hive; Verwenden von Phoenix zur Datenaufbereitung
Voraussetzungen
- geübt im Umgang mit der Java Programmiersprache (die meisten Übungen sind in Java)
- geübt in der Verwendung des Linux-Umfeldes (imstande, den Linux-Kommandozeileninterpreter zu bedienen und Dateien mit vi/nano zu bearbeiten)
- grundlegende Kenntnisse von Hadoop.
Lab-Umgebung
Null-Installationsnotwendigkeit: Es ist nicht notwendig, die Hadoop-Software auf den Rechnern der Teilnehmer zu installieren! Es wird eine funktionsfähige Hadoop-Klusterumgebung bereitgestellt.
Die Teilnehmer benötigen Folgendes
Erfahrungsberichte (5)
Die Live-Beispiele
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung
Während der Übungen erklärte James mir jeden Schritt detaillierter, wo immer ich festsaß. Ich war komplett neu in NIFI. Er erläuterte den tatsächlichen Zweck von NIFI, sogar die Grundlagen wie Open Source. Er ging alle Konzepte von NIFI von Anfänger- bis Entwickler-Level durch.
Firdous Hashim Ali - MOD A BLOCK
Kurs - Apache NiFi for Administrators
Maschinelle Übersetzung
Vorbereitung und Organisation des Trainers sowie die Qualität der bereitgestellten Materialien auf GitHub.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurs - Impala for Business Intelligence
Maschinelle Übersetzung
Dass ich es überhaupt hatte.
Peter Scales - CACI Ltd
Kurs - Apache NiFi for Developers
Maschinelle Übersetzung
praktische Dinge der Umsetzung, auch die Theorie wurde gut von Ajay vermittelt
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurs - Hadoop Administration on MapR
Maschinelle Übersetzung