Startseite
Big Data Schulungen
Hadoop Schulungen
Hadoop für Administratoren Schulung

Hadoop für Administratoren Schulung

Apache Hadoop ist das beliebteste Framework für die Verarbeitung von Big Data auf Serverclusters. In diesem drei- (optional vier-) Tageskurs lernen Teilnehmer über den Geschäftsvorteile und Einsatzmöglichkeiten von Hadoop und seinem Ökosystem, wie man einen Cluster bereitstellt und ausbaut, wie man Hadoop installiert, betreibt, überwacht, Fehler behebt und optimiert. Sie werden auch die Massendaten-Import in Clusters praktizieren, verschiedene Verteilungen von Hadoop kennen lernen und die Installation und Verwaltung von Tools des Hadoop-Ökosystems üben. Der Kurs endet mit einer Diskussion über das Schützen des Clusters mit Kerberos.

“…Die Materialien waren sehr gut vorbereitet und detailliert abgedeckt. Das Labor war sehr hilfreich und gut organisiert”— Andrew Nguyen, Principal Integration DW Engineer, Microsoft Online Advertising

Zielgruppe

Hadoop-Administratoren

Format

Vorlesungen und praktische Labore, ungefährer Teilungsgrad 60% Vorlesungen, 40% Labore.

Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.

Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.

Schulungsübersicht

Einführung
- Hadoop Geschichte, Konzepte
- Ökosystem
- Verteilungen
- Hochrangige Architektur
- Hadoop Mythen
- Hadoop Herausforderungen (Hardware / Software)
- Labore: Diskussion von Big Data Projekten und Problemen
Planung und Installation
- Auswahl der Software, Hadoop Verteilungen
- Skalierung des Clusters, Planung für Wachstum
- Auswahl von Hardware und Netzwerk
- Rack-Topologie
- Installation
- Mehrere Mandanten
- Verzeichnisstruktur, Protokolle
- Benchmarking
- Labore: Cluster-Installation, Ausführen von Performance-Benchmarks
HDFS-Vorgänge
- Konzepte (horizontale Skalierung, Replication, Datennähe, Rack-Awareness)
- Knoten und Daemons (NameNode, Secondary NameNode, HA Standby NameNode, DataNode)
- Gesundheitsmonitoring
- Kommandozeilen- und Browser-basierte Verwaltung
- Hinzufügen von Speicher, Austausch defekter Laufwerke
- Labore: Bekanntwerden mit HDFS-Kommandos
Datenverarbeitung
- Flume für Logs und andere Dateneingänge in das HDFS
- Sqoop zur Importierung aus SQL Datenbanken ins HDFS sowie Export zurück zu SQL
- Hadoop Data-Warehousing mit Hive
- Kopieren von Daten zwischen Clustern (distcp)
- Verwendung von S3 als Ergänzung zum HDFS
- Best Practices und Architekturen für Dateneingänge
- Labore: Einrichten und Benutzen von Flume, sowie Sqoop
MapReduce-Vorgänge und Verwaltung
- Parallele Berechnung vor Mapreduce: Vergleich HPC vs Hadoop Verwaltung
- MapReduce-Cluster-Belastungen
- Knoten und Daemons (JobTracker, TaskTracker)
- Durchführung der MapReduce-Oberfläche
- Mapreduce-Konfiguration
- Jobkonfiguration
- Optimierung von MapReduce
- Fehlerfrei machen von MR: Was den Programmierern mitzuteilen ist
- Labore: Ausführen von MapReduce-Beispielen
YARN: Neue Architektur und neue Fähigkeiten
- YARN-Gestaltungsziele und Implementierungsarchitektur
- Neue Akteure: ResourceManager, NodeManager, Application Master
- Installation von YARN
- Job-Planung unter YARN
- Labore: Untersuchung der Job-Planung
Fortgeschrittene Themen
- Hardware-Monitoring
- Cluster-Monitoring
- Hinzufügen und Entfernen von Servern, Upgraden Hadoop
- Sicherung, Wiederherstellung und Geschäftskontinuitätsplanung
- Oozie-Job-Workflows
- Hadoop Hochverfügbarkeit (HA)
- Hadoop Federation
- Sicherung des Clusters mit Kerberos
- Labore: Einrichten von Monitoring
Optionale Tracks
- Cloudera Manager für Cluster-Verwaltung, -Monitoring und Routine-Aufgaben; Installation, Nutzung. In diesem Track werden alle Übungen und Labore im Umfeld der Cloudera Distribution (CDH5) durchgeführt.
- Ambari für Cluster-Verwaltung, Monitoring und Routinetätigkeiten; Installation, Nutzung. In diesem Track werden alle Übungen und Labore innerhalb des Hortonworks Data Platforms (HDP 2.0) durchgeführt.

Voraussetzungen

komfortabel mit der grundlegenden Systemverwaltung
grundlegende Skriptfähigkeiten

Wissen über Hadoop und verteiltes Rechnen ist nicht erforderlich, wird aber im Kurs eingeführt und erklärt.

Lab-Umgebung

Zero Install : Es ist kein Hadoop-Software auf den Studentenrechnern zu installieren! Ein funktionierender Hadoop-Cluster wird für die Studierenden zur Verfügung gestellt.

Die Studierenden benötigen Folgendes

einen SSH-Client (unter Linux und Mac sind ssh-Clients bereits integriert, für Windows wird Putty empfohlen)
einen Browser zum Zugriff auf den Cluster. Wir empfehlen den Firefox-Browser mit der FoxyProxy-Erweiterung

21 Stunden

Teilnehmerzahl

(Online)

Klassenzimmer

Schulungsort auswählen

Bitte wählen Sie einen Veranstaltungsort

Preis je Teilnehmer (exkl. USt)

Offene Schulungskurse erfordern mindestens 5 Teilnehmer.

Hadoop für Administratoren Schulung - Buchung

Vollständiger Name *

E-Mail *

Telefon *

Job Titel

Firmenname

Adresse 1 *

Stadt *

Bundesland / Region

Land *

Postleitzahl *

Starttermin

Steuer-ID

Die Termine unterliegen der Verfügbarkeit und finden zwischen 09:30 und 16:30 statt.

Zahlung *

Banküberweisung (Rechnung, Bestellung)

Debit / Kredit Karte

Kommentare

Allgemeine Geschäftsbedingungen *

Ich bin ein bevollmächtigter Vertreter des oben genannten Kunden und möchte die oben genannten Kurse oder Dienstleistungen in Übereinstimmung mit den Allgemeinen Geschäftsbedingungen und der Datenschutzrichtlinie von NobleProg buchen.

Informieren Sie mich über Rabatte und Sonderangebote

Bitte lesen Sie unsere Datenschutzerklärung , um zu erfahren, wie wir Ihre Daten verwenden.

Hadoop für Administratoren Schulung - Anfrage

Vollständiger Name *

E-Mail *

Telefon *

Teilnehmerzahl

Firmenname

Firmenadresse

Wie möchten Sie den Kurs absolvieren?

Geschäftsräume des Kunden

Online

Schulungsraum

Kommentare

Informieren Sie mich über Rabatte und Sonderangebote

Bitte lesen Sie unsere Datenschutzerklärung , um zu erfahren, wie wir Ihre Daten verwenden.

Hadoop für Administratoren - Beratungsanfrage

Vollständiger Name *

Telefon *

E-Mail *

Firmenname

Thema der Beratung *

Ziel der Beratung

Mit wem wird der Berater zusammenarbeiten?

Dringlichkeit der Beratung *

Kommentare

Informieren Sie mich über Rabatte und Sonderangebote

Bitte lesen Sie unsere Datenschutzerklärung , um zu erfahren, wie wir Ihre Daten verwenden.

Erfahrungsberichte (1)

Praktische Übungen. Die Kursdauer sollte eigentlich fünf Tage betragen, aber die drei Tage halfen dabei, viele Fragen zu klären, die ich bei der Arbeit mit NiFi bereits hatte.

James - BHG Financial

Kurs - Apache NiFi for Administrators

Maschinelle Übersetzung

Kommende Kurse

Hadoop für Administratoren

2026-06-16 09:30

21 Stunden

Hamburg

5208 EUR (Online)

5808 EUR (Schulungsraum)

Hadoop für Administratoren

2026-06-30 09:30

21 Stunden

München

5208 EUR (Online)

5808 EUR (Schulungsraum)

Hadoop für Administratoren

2026-07-14 09:30

21 Stunden

Köln

5208 EUR (Online)

5808 EUR (Schulungsraum)

Hadoop für Administratoren

2026-07-28 09:30

21 Stunden

Frankfurt am Main

5208 EUR (Online)

5808 EUR (Schulungsraum)

Kombinierte Kurse

Administratorschulung für Apache Hadoop

35 Stunden

Zielgruppe:

Der Kurs richtet sich an IT-Spezialisten, die nach einer Lösung suchen, um große Datensätze in einer verteilten Systemumgebung zu speichern und zu verarbeiten.

GoVoraussetzungen:

Tiefes Wissen über die Verwaltung von Hadoop-Clustern.

Mehr Informationen...

Big Data Analytics in der Gesundheitsversorgung

21 Stunden

Die Big Data-Analytics beinhaltet den Prozess, große Mengen an vielfältigen Datensätzen zu untersuchen, um Zusammenhänge, verborgene Muster und andere nützliche Erkenntnisse aufzudecken.

Der Gesundheitssektor verfügt über riesige Mengen komplexer, heterogener medizinischer und klinischer Daten. Die Anwendung von Big Data-Analytics auf gesundheitliche Daten bietet enormes Potenzial zur Ableitung von Erkenntnissen für die Verbesserung der Gesundheitsversorgung. Allerdings stellen die Größenordnungen dieser Datensätze große Herausforderungen bei der Analyse und den praktischen Anwendungen in einem klinischen Umfeld dar.

In diesem von einem Dozenten geleiteten, Live-Training (Remote) werden die Teilnehmer lernen, wie man Big Data-Analytics in der Gesundheitsversorgung durchführt, indem sie eine Reihe praktischer Übungen durchlaufen.

Bis zum Ende dieses Trainings werden die Teilnehmer in der Lage sein:

Hadoop MapReduce und Spark zu installieren und zu konfigurieren
Die Eigenschaften medizinischer Daten zu verstehen
Große Datentechniken zur Bearbeitung von medizinischen Daten anzuwenden
Große Datensysteme und Algorithmen im Kontext von Gesundheitsanwendungen zu studieren

Zielgruppe

Entwickler
Data Scientists

Kursformat

Vorlesungsteil, Diskussionsteil, Übungen und praktische Anwendung.

Hinweis

Um ein angepasstes Training für diesen Kurs anzufordern, kontaktieren Sie uns bitte, um eine Terminvereinbarung zu treffen.

Mehr Informationen...

Hadoop für Entwickler (4 Tage)

28 Stunden

Apache Hadoop ist der populärste Framework zur Verarbeitung von Big Data auf Clustern von Servern. Dieses Kurs wird einen Entwickler in verschiedene Komponenten des Hadoop-Ökosystems (HDFS, MapReduce, Pig, Hive und HBase) einführen.

Mehr Informationen...

Advanced Hadoop für Entwickler

21 Stunden

Apache Hadoop ist eines der beliebtesten Frameworks zur Verarbeitung von Big Data auf Clustern von Servern. Dieses Kurs geht tief in die Datenverwaltung in HDFS, fortgeschrittene Pig, Hive und HBase ein. Diese fortgeschrittenen Programmiermethoden werden erfahrenen Hadoop-Entwicklern zugutekommen.

Zielgruppe: Entwickler

Dauer: drei Tage

Format: Vorlesungen (50%) und praktische Übungen (50%).

Mehr Informationen...

Hadoop-Verwaltung auf MapR

28 Stunden

Zielgruppe:

Dieser Kurs soll Big Data/Hadoop-Technologie entmystifizieren und zeigen, dass sie nicht schwer zu verstehen ist.

Mehr Informationen...

Hadoop und Spark für Administratoren

35 Stunden

Dieses von einem Dozenten geleitete Live-Training in Deutschland (online oder vor Ort) richtet sich an Systemadministratoren, die lernen möchten, wie sie Hadoop-Cluster in ihrer Organisation einrichten, bereitstellen und verwalten.

Am Ende dieses Trainings werden die Teilnehmer in der Lage sein:

Apache Hadoop zu installieren und zu konfigurieren.
Die vier Hauptkomponenten des Hadoop-Ökosystems zu verstehen: HDFS, MapReduce, YARN und Hadoop Common.
Hadoop Distributed File System (HDFS) zum Skalieren eines Clusters auf Hunderte oder Tausende von Knoten zu verwenden.
HDFS als Speicher-Engine für lokale Spark-Bereitstellungen einzurichten.
Spark zum Zugriff auf alternative Speicherlösungen wie Amazon S3 und NoSQL-Datenbanksysteme wie Redis, Elasticsearch, Couchbase, Aerospike etc. einzurichten.
Administrative Aufgaben wie Bereitstellung, Verwaltung, Überwachung und Sicherung eines Apache Hadoop-Clusters durchzuführen.

Mehr Informationen...

HBase für Entwickler

21 Stunden

Dieser Kurs stellt HBase vor – eine NoSQL-Datenbank auf Basis von Hadoop. Der Kurs richtet sich an Entwickler, die HBase zur Entwicklung von Anwendungen verwenden werden, sowie an Administratoren, die HBase-Clusters verwalten werden.

Wir führen die Entwickler durch die Architektur und Datenmodellierung von HBase sowie die Anwendungsentwicklung auf HBase. Der Kurs behandelt auch die Verwendung von MapReduce mit HBase und einige Administrations-Themen im Zusammenhang mit der Leistungsoptimierung. Der Kurs ist sehr praxisorientiert und enthält viele Laborübungen.

Dauer : 3 Tage

Zielgruppe : Entwickler & Administratoren

Mehr Informationen...

Apache NiFi für Administratorinnen und Administratorinnen

21 Stunden

Apache NiFi ist eine Open-Source-Plattform für flussbasierte Datenintegration und Ereignisverarbeitung. Sie ermöglicht die automatisierte, in Echtzeit stattfindende Datenrouting-, Transformations- und Systemvermittlungsfunktionen zwischen unterschiedlichen Systemen mit einer webbasierten Benutzeroberfläche und feingranularen Kontrollmöglichkeiten.

Dieses vom Trainer geleitete, live Training (vor Ort oder remote) richtet sich an fortgeschrittene Administratoren und Ingenieure, die NiFi-Datenflüsse in Produktionsumgebungen bereitstellen, verwalten, schützen und optimieren möchten.

Zum Ende dieses Trainings werden die Teilnehmer in der Lage sein:

Apache NiFi-Clusters zu installieren, zu konfigurieren und zuwartenden.
Datenflüsse von verschiedenen Quellen und Senken zu planen und zu verwalten.
Flussautomatisierung, Routing und Transformationslogik umzusetzen.
Die Leistung zu optimieren, Operationen zu überwachen und Probleme zu beheben.

Kursformat

Interaktive Vorlesung mit Diskussion realer Architekturen.
Praktische Übungen: Erstellen, Bereitstellen und Verwalten von Flüssen.
Szenario-basierte Aufgaben in einer Live-Lab-Umgebung.

Kursanpassungsoptionen

Für eine angepasste Schulung für diesen Kurs kontaktieren Sie uns, um einen Termin zu vereinbaren.

Mehr Informationen...

Apache NiFi für Entwickler

7 Stunden

In dieser Live-Schulung unter Anleitung in Deutschland lernen die Teilnehmer die Grundlagen der ablaufbasierten Programmierung, während sie eine Reihe von Demo-Erweiterungen, Komponenten und Prozessoren mit Apache NiFi entwickeln.

Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:

Die Architektur von NiFi und Datenflusskonzepte zu verstehen.
Erweiterungen mit NiFi und APIs von Drittanbietern zu entwickeln.
Ihren eigenen Apache-NiFi-Prozessor zu entwickeln.
Echtzeitdaten aus unterschiedlichen und ungewöhnlichen Dateiformaten und Datenquellen einlesen und verarbeiten.

Mehr Informationen...

Python, Spark und Hadoop für Big Data

21 Stunden

Diese von einem Trainer geleitete Live-Schulung in Deutschland (online oder vor Ort) richtet sich an Entwickler, die Spark, Hadoop und Python verwenden und integrieren möchten, um große und komplexe Datensätze zu verarbeiten, zu analysieren und zu transformieren.

Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:

die notwendige Umgebung einzurichten, um mit der Verarbeitung von Big Data mit Spark, Hadoop und Python zu beginnen.
die Funktionen, Kernkomponenten und Architektur von Spark und Hadoop zu verstehen.
Lernen, wie man Spark, Hadoop und Python für die Verarbeitung von Big Data integriert.
Erkunden Sie die Werkzeuge im Spark-Ökosystem (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka und Flume).
Erstellen Sie Empfehlungssysteme mit kollaborativer Filterung ähnlich wie bei Netflix, YouTube, Amazon, Spotify und Google.
Apache Mahout zur Skalierung von maschinellen Lernalgorithmen verwenden.

Mehr Informationen...

Hadoop für Administratoren Schulung

Zielgruppe

Format

Schulungsübersicht

Voraussetzungen

Lab-Umgebung

Erfahrungsberichte (1)

James - BHG Financial

Kurs - Apache NiFi for Administrators

Kommende Kurse

Hadoop für Administratoren

Hadoop für Administratoren

Hadoop für Administratoren

Hadoop für Administratoren

Verwandte Kategorien

Diese Seite in anderen Ländern/Regionen

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites