Hadoop for Data Analysts Schulung

Haupt-Reiter

Schulungsprache

Dieser Kurs wird auf Deutsch und Englisch angeboten

Kurs Code

68737

Dauer

14 Stunden (usually 2 days including breaks)

Voraussetzungen

Überblick

Schulungsübersicht

Hadoop Fundamentals

  • The Motivation for Hadoop
  • Hadoop Overview
  • HDFS
  • MapReduce
  • The Hadoop Ecosystem
  • Lab Scenario Explanation
  • Hands-On Exercise: Data Ingest with Hadoop Tools

Introduction to Pig

  • What Is Pig?
  • Pig’s Features
  • Pig Use Cases
  • Interacting with Pig

Basic Data Analysis with Pig

  • Pig Latin Syntax
  • Loading Data
  • Simple Data Types
  • Field Definitions
  • Data Output
  • Viewing the Schema
  • Filtering and Sorting Data
  • Commonly-Used Functions
  • Hands-On Exercise: Using Pig for ETL Processing

Processing Complex Data with Pig

  • Storage Formats
  • Complex/Nested Data Types
  • Grouping
  • Built-in Functions for Complex Data
  • Iterating Grouped Data
  • Hands-On Exercise: Analyzing Ad Campaign

Data with Pig Multi-Dataset Operations with Pig

  • Techniques for Combining Data Sets
  • Joining Data Sets in Pig
  • Set Operations
  • Splitting Data Sets
  • Hands-On Exercise: Analyzing Disparate

Data Sets with Pig Extending Pig

  • Adding Flexibility with Parameters
  • Macros and Imports
  • UDFs
  • Contributed Functions
  • Using Other Languages to Process Data with Pig
  • Hands-On Exercise: Extending Pig with Streaming and UDFs

Pig Troubleshooting and Optimization

  • Troubleshooting Pig
  • Logging
  • Using Hadoop’s Web UI
  • Optional Demo: Troubleshooting a Failed Job with the Web UI
  • Data Sampling and Debugging
  • Performance Overview
  • Understanding the Execution Plan
  • Tips for Improving the Performance of Your Pig Jobs

Introduction to Hive

  • What Is Hive?
  • Hive Schema and Data Storage
  • Comparing Hive to Traditional Databases
  • Hive vs. Pig
  • Hive Use Cases
  • Interacting with Hive

Relational Data Analysis with Hive

  • Hive Databases and Tables
  • Basic HiveQL Syntax
  • Data Types
  • Joining Data Sets
  • Common Built-in Functions
  • Hands-On Exercise: Running Hive Queries on the Shell, Scripts, and Hue

Hive Data Management

  • Hive Data Formats
  • Creating Databases and Hive-Managed Tables
  • Loading Data into Hive
  • Altering Databases and Tables
  • Self-Managed Tables
  • Simplifying Queries with Views
  • Storing Query Results
  • Controlling Access to Data
  • Hands-On Exercise: Data Management with Hive

Text Processing with Hive

  • Overview of Text Processing
  • Important String Functions
  • Using Regular Expressions in Hive
  • Sentiment Analysis and N-Grams
  • Hands-On Exercise (Optional): Gaining Insight with Sentiment Analysis

Hive Optimization

  • Understanding Query Performance
  • Controlling Job Execution Plan
  • Partitioning
  • Bucketing
  • Indexing Data

Extending Hive

  • SerDes
  • Data Transformation with Custom Scripts
  • User-Defined Functions
  • Parameterized Queries
  • Hands-On Exercise: Data Transformation with Hive

Introduction to Impala

  • What is Impala?
  • How Impala Differs from Hive and Pig
  • How Impala Differs from Relational Databases
  • Limitations and Future Directions
  • Using the Impala Shell

Analyzing Data with Impala

  • Basic Syntax
  • Data Types
  • Filtering, Sorting, and Limiting Results
  • Joining and Grouping Data
  • Improving Impala Performance
  • Hands-On Exercise: Interactive Analysis with Impala

Choosing the Best Tool for the Job

  • Comparing MapReduce, Pig, Hive, Impala, and Relational Databases
  • Which to Choose?

Öffentlicher Klassenraum Öffentlicher Klassenraum
Teilnehmer aus verschiedenen Organisationen. Die Themen können hier nicht angepasst werden.
Von 4420EUR
Request
Privater Klassenraum Privater Klassenraum
Die Teilnehmer sind aus einem Unternehmen. Externe Teilnehmer sind nicht erlaubt. Der Kurs ist speziell auf eine Gruppe zugeschnitten, Die Themen werden genau auf die Bedürfnisse der Teilnehmer abgestimmt.
Von 4420EUR
Angebot erfragen
Privater Fernkurs Privater Fernkurs
Der Anleiter und die Teilnehmer befinden sich an unterschiedlichen Orten und kommunizieren über das Internet miteinander.
Von 3920EUR
Angebot erfragen

Je mehr Teilnehmer, desto höher die Ersparnis pro Teilnehmer. Die Tabelle reflektiert den Preis pro Teilnehmer und dient zur Veranschaulichung. Die tatsächlichen Preise können jedoch abweichen.

Number of Delegates Öffentlicher Klassenraum Privater Klassenraum Privater Fernkurs
1 4420EUR 4420EUR 3920EUR
2 2575EUR 2550EUR 2300EUR
3 1960EUR 1927EUR 1760EUR
4 1653EUR 1615EUR 1490EUR
Können Sie kein passendes Datum finden? Fordern Sie ein neues Kursdatum an >>
Zu teuer? Schlagen Sie einen Preis vor >>

Verwandte Kategorien


Spezialangebote

EINIGE UNSERER KUNDEN