Startseite
Big Data Schulungen
Hadoop Schulungen
Administratorschulung für Apache Hadoop Schulung

Administratorschulung für Apache Hadoop Schulung

Zielgruppe:

Der Kurs richtet sich an IT-Spezialisten, die nach einer Lösung suchen, um große Datensätze in einer verteilten Systemumgebung zu speichern und zu verarbeiten.

GoVoraussetzungen:

Tiefes Wissen über die Verwaltung von Hadoop-Clustern.

Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.

Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.

Schulungsübersicht

1: HDFS (17%)

Beschreiben Sie die Funktion der HDFS Daemons
Beschreiben Sie den normalen Betrieb einer Apache Hadoop Cluster, sowohl bei Daten speichern als auch bei Daten verarbeiten.
Identifizieren Sie aktuelle Merkmale von Rechnersystemen, die ein System wie Apache Hadoop motivieren.
Klassifizieren Sie die Hauptziele der HDFS Design
Gegeben eine Situation, identifizieren Sie den passenden Anwendungsbereich für HDFS Federation
Identifizieren Sie Komponenten und Daemon eines HDFS HA-Quorum Clusters
Analyisieren Sie die Rolle der HDFS Sicherheit (Kerberos)
Bestimmen Sie die beste Datenserialisierungsoption für eine gegebene Situation
Beschreiben Sie den Pfad zur Dateilese- und Schreiboperationen
Identifizieren Sie die Befehle zum Manipulieren von Dateien im Hadoop File System Shell

2: YARN und MapReduce Version 2 (MRv2) (17%)

Verstehen Sie, wie die Aktualisierung eines Clusters von Hadoop 1 zu Hadoop 2 die Cluster-Einstellungen beeinflusst
Verstehen Sie, wie MapReduce v2 (MRv2 / YARN) bereitgestellt wird, einschließlich aller YARN Daemons
Verstehen Sie die grundlegende Designstrategie für MapReduce v2 (MRv2)
Bestimmen Sie, wie YARN Ressourcen zuweist
Identifizieren Sie den Ablauf eines MapReduce Jobs auf YARN
Bestimmen Sie, welche Dateien geändert werden müssen und wie, um einen Cluster von MapReduce Version 1 (MRv1) zu MapReduce Version 2 (MRv2) auf YARN zu migrieren.

3: Hadoop Cluster Planung (16%)

Hauptpunkte zu berücksichtigen beim Wahl von Hardware und Betriebssysteme für die Hosting eines Apache Hadoop Clusters.
Analysieren Sie die Auswahlmöglichkeiten bei der Betriebssystemauswahl
Verstehen Sie Kernel-Optimierung und Festplattenaustausch
Gegeben eine Situation und ein Arbeitsmuster, identifizieren Sie eine passende Hardware-Konfiguration für die Situation
Gegeben eine Situation, bestimmen Sie die Komponenten des Ökosystems, die Ihr Cluster benötigen um die SLA zu erfüllen
Clusterskalierung: gegeben eine Situation und Häufigkeit der Ausführung, identifizieren Sie die spezifischen Anforderungen für den Arbeitslasten, einschließlich CPU, Speicher, Speicherplatz, Festplatten I/O
Festplattengröße und -Konfiguration, einschließlich JBOD gegen RAID, SANs, Virtualisierung und Festplattengrößenanforderungen in einem Cluster
Netztopologien: Verstehen Sie die Netzwerkverwendung in Hadoop (für sowohl HDFS als auch MapReduce) und schlagen oder identifizieren Sie wichtige Komponenten der Netzwerkdesign für eine gegebene Situation vor

4: Hadoop Cluster Installation und Verwaltung (25%)

Gegeben eine Situation, identifizieren Sie, wie der Cluster Festplatten- und Maschinenschäden behandelt
Analysieren Sie die Konfiguration des Loggings und die Dateiformate der Logging-Konfiguration
Verstehen Sie die Grundlagen von Hadoop Metriken und Cluster-Gesundheitsüberwachung
Identifizieren Sie die Funktionen und Zwecke der verfügbaren Tools zur Überwachung des Clusters
Installieren Sie alle Komponenten des Ökosystems in CDH 5, einschließlich (aber nicht beschränkt auf): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive und Pig
Identifizieren Sie die Funktionen und Zwecke der verfügbaren Tools zur Verwaltung des Apache Hadoop Dateisystems

5: RessourcenManagement (10%)

Verstehen Sie die übergeordneten Designziele jedes Hadoop-Scheduler
Gegeben eine Situation, bestimmen Sie, wie der FIFO Scheduler Ressourcen des Clusters zuweist
Gegeben eine Situation, bestimmen Sie, wie der Fair Scheduler Ressourcen unter YARN zuweist
Gegeben eine Situation, bestimmen Sie, wie der Capacity Scheduler Ressourcen des Clusters zuweist

6: Überwachung und Logging (15%)

Verstehen Sie die Funktionen und Merkmale der Metrik-Sammlungs-Verfahren von Hadoop
Analysieren Sie die NameNode und JobTracker Web UIs
Verstehen Sie, wie Cluster-Daemons überwacht werden
Identifizieren und überwachen Sie den CPU-Aufwand auf Master-Knoten
Beschreiben Sie die Überwachung von Auslagerungs- und Speicherallokation auf allen Knoten
Identifizieren Sie, wie Sie Hadoop-Logfiles ansehen und verwalten können
Interpretieren Sie eine Logdatei

Voraussetzungen

Grundlegende Administrationsfähigkeiten Linux
Grundlegende Programmierkenntnisse

35 Stunden

Teilnehmerzahl

(Online)

Klassenzimmer

Schulungsort auswählen

Bitte wählen Sie einen Veranstaltungsort

Preis je Teilnehmer (exkl. USt)

Offene Schulungskurse erfordern mindestens 5 Teilnehmer.

Administratorschulung für Apache Hadoop Schulung - Buchung

Vollständiger Name *

E-Mail *

Telefon *

Job Titel

Firmenname

Adresse 1 *

Stadt *

Bundesland / Region

Land *

Postleitzahl *

Starttermin

Steuer-ID

Die Termine unterliegen der Verfügbarkeit und finden zwischen 09:30 und 16:30 statt.

Zahlung *

Banküberweisung (Rechnung, Bestellung)

Debit / Kredit Karte

Kommentare

Allgemeine Geschäftsbedingungen *

Ich bin ein bevollmächtigter Vertreter des oben genannten Kunden und möchte die oben genannten Kurse oder Dienstleistungen in Übereinstimmung mit den Allgemeinen Geschäftsbedingungen und der Datenschutzrichtlinie von NobleProg buchen.

Informieren Sie mich über Rabatte und Sonderangebote

Bitte lesen Sie unsere Datenschutzerklärung , um zu erfahren, wie wir Ihre Daten verwenden.

Administratorschulung für Apache Hadoop Schulung - Anfrage

Vollständiger Name *

E-Mail *

Telefon *

Teilnehmerzahl

Firmenname

Firmenadresse

Wie möchten Sie den Kurs absolvieren?

Geschäftsräume des Kunden

Online

Schulungsraum

Kommentare

Informieren Sie mich über Rabatte und Sonderangebote

Bitte lesen Sie unsere Datenschutzerklärung , um zu erfahren, wie wir Ihre Daten verwenden.

Administratorschulung für Apache Hadoop - Beratungsanfrage

Beratungsanfrage

Vollständiger Name *

Telefon *

E-Mail *

Firmenname

Thema der Beratung *

Ziel der Beratung

Mit wem wird der Berater zusammenarbeiten?

Dringlichkeit der Beratung *

Kommentare

Informieren Sie mich über Rabatte und Sonderangebote

Bitte lesen Sie unsere Datenschutzerklärung , um zu erfahren, wie wir Ihre Daten verwenden.

Erfahrungsberichte (3)

I genuinely enjoyed the many hands-on sessions.

Jacek Pieczatka

Kurs - Administrator Training for Apache Hadoop

Maschinelle Übersetzung

I genuinely enjoyed the big competences of Trainer.

Grzegorz Gorski

Kurs - Administrator Training for Apache Hadoop

Maschinelle Übersetzung

I mostly liked the trainer giving real live Examples.

Simon Hahn

Kurs - Administrator Training for Apache Hadoop

Maschinelle Übersetzung

Kommende Kurse

Administratorschulung für Apache Hadoop

2025-12-29 09:30

35 Stunden

München

8680 EUR (Online)

9680 EUR (Schulungsraum)

Administratorschulung für Apache Hadoop

2026-01-12 09:30

35 Stunden

Köln

8680 EUR (Online)

9680 EUR (Schulungsraum)

Administratorschulung für Apache Hadoop

2026-01-26 09:30

35 Stunden

Frankfurt am Main

8680 EUR (Online)

9680 EUR (Schulungsraum)

Administratorschulung für Apache Hadoop

2026-02-09 09:30

35 Stunden

Düsseldorf

8680 EUR (Online)

9680 EUR (Schulungsraum)

Kombinierte Kurse

Programming mit Big Data in R

21 Stunden

Big Data ist ein Begriff, der sich auf Lösungen zur Speicherung und Verarbeitung großer Datensätze bezieht. Ursprünglich von Google entwickelt, haben diese Big Data-Lösungen sich weiterentwickelt und andere ähnliche Projekte inspiriert, viele davon sind als Open-Source verfügbar. R ist eine weit verbreitete Programmiersprache in der Finanzbranche.

Mehr Informationen...

Datenanalyse mit R

21 Stunden

R ist eine sehr beliebte, Open-Source-Umgebung für statistische Berechnungen, Datenanalyse und Grafiken. Dieser Kurs führt Studenten in die R-Programmiersprache ein. Er behandelt Sprachgrundlagen, Bibliotheken und fortgeschrittene Konzepte. Fortgeschrittene Datenanalyse und Visualisierung mit realen Daten.

Zielgruppe

Entwickler / Datenanalysten

Dauer

3 Tage

Format

Vorlesungen und praktische Übungen

Mehr Informationen...

Econometrics: Eviews und Risk Simulator

21 Stunden

Dieses von einem Trainer geleitete, live-Training in Deutschland (online oder vor Ort) richtet sich an alle, die das Grundwissen der ökonometrischen Analyse und Modellierung erlernen und meistern möchten.

Am Ende dieses Trainings werden die Teilnehmer in der Lage sein:

Das Grundwissen der Ökonometrie zu erlernen und zu verstehen.
Eviews und Risikosimulatoren zu nutzen.

Mehr Informationen...

Prognosen mit R

14 Stunden

Diese von einem Trainer durchgeführte Live-Ausbildung in Deutschland (online oder vor Ort) richtet sich an fortgeschrittene Datenanalytiker und Geschäftsanalysten, die Zeitreihenvorhersagen durchführen und Prozesse der Datenauswertung mit R automatisieren möchten.

Am Ende dieser Ausbildung werden die Teilnehmer in der Lage sein:

Grundlagen der Vorhersageverfahren in R zu verstehen.
Exponentielles Glätten und ARIMA-Modelle für Zeitreihenanalyse anzuwenden.
Das Paket ‘forecast’ zur Generierung genauer Vorhersagemodelle zu nutzen.
Vorhersageprozesse für Geschäftsanwendungen und Forschung automatisieren.

Mehr Informationen...

HR-Analytik für öffentliche Organisationen

14 Stunden

Dieser von einem Trainer geleitete Live-Kurs (online oder vor Ort) richtet sich an HR-Professionals, die analytische Methoden einsetzen möchten, um die Organisationsleistung zu verbessern. Der Kurs deckt qualitative und quantitative sowie empirische und statistische Ansätze ab.

Format des Kurses

Interaktive Vorlesung und Diskussion.
Viel Übungsmaterial und Praxis.

Anpassungsoptionen des Kurses

Wenn Sie eine angepasste Ausbildung zu diesem Kurs wünschen, kontaktieren Sie uns bitte für die Abwicklung.

Mehr Informationen...

Marketinganalytik mit R

21 Stunden

Zielgruppe

Unternehmensinhaber (Marketing-Manager, Produktmanager, Kundendaten-Manager) und ihre Teams; Fachleute für Kundenkenntnisse.

Überblick

Der Kurs folgt dem Kundenlebenszyklus von der Gewinnung neuer Kunden über die Verwaltung bestehender Kunden zur Erzielung von Gewinnen, bis hin zur Bindung guter Kunden und schließlich zum Verstehen, welche Kunden uns verlassen und warum. Wir arbeiten mit echten (anonymisierten) Daten aus verschiedenen Branchen, einschließlich Telekommunikation, Versicherung, Medien und Hochtechnologie.

Format

Lehrerführte Schulungen über den Zeitraum von fünf halbtägigen Sitzungen mit Klassenübungen sowie Hausaufgaben. Der Kurs kann sowohl als Präsenz- als auch als Distanzschulung (online) angeboten werden.

Mehr Informationen...

R für Datenanalyse und Forschung

7 Stunden

Publikum

Manager
Entwickler
Wissenschaftler
Studenten

Format des Kurses

Online-Unterricht und Diskussion ODER persönliche Workshops

Mehr Informationen...

Einführung in R

21 Stunden

R ist eine Open-Source-freie Programmiersprache für statistische Computing, Datenanalyse und Grafik. Die Forschung wird von einer wachsenden Anzahl von Managern und Datenanalytikern innerhalb von Unternehmen und Akademien verwendet. R hat auch Nachfolger unter Statistikern, Ingenieuren und Wissenschaftlern ohne Computerprogrammierungsfähigkeiten gefunden, die es einfach zu verwenden finden. Seine Beliebtheit liegt an der zunehmenden Verwendung von Data Mining für verschiedene Ziele, wie z. B. Anzeigenpreise, neue Medikamente schneller zu finden oder fin-tune Finanzmodelle. R verfügt über eine breite Palette von Paketen für die Datenmining.

Dieser Kurs umfasst die Manipulation von Objekten in R einschließlich Lesendaten, Zugriff auf R-Pakete, Schreiben R-Funktionen und Erstellen von informativen Grafiken. Es umfasst die Analyse von Daten mit gemeinsamen statistischen Modellen. Der Kurs lehrt, wie man die R-Software (https://www.r-project.org) sowohl auf einer Befehllinie als auch in einer grafischen Benutzeroberfläche (GUI) verwendet.

Mehr Informationen...

Einführung in R für Biologen

28 Stunden

R ist eine freie Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Anzahl von Managern und Datenanalysten in Unternehmen und Hochschulen verwendet. R hat auch Anhänger unter Statistikern, Ingenieuren und Wissenschaftlern ohne Programmierkenntnisse gefunden, die es einfach finden, es zu benutzen. Seine Popularität ist auf den zunehmenden Einsatz von Data Mining für verschiedene Zwecke zurückzuführen, z. B. die Festlegung von Anzeigenpreisen, die schnellere Suche nach neuen Arzneimitteln oder die Feinabstimmung von Finanzmodellen. R bietet eine Vielzahl von Paketen für das Data Mining.

Mehr Informationen...

R

21 Stunden

Mehr Informationen...

Training Neural Network in R

14 Stunden

Dieses Kurs ist eine Einführung in die Anwendung von neuronalen Netzen bei realen Problemen mit der Software R-project.

Mehr Informationen...

Fortgeschrittene "R"-Programmierung

7 Stunden

Dieser Kurs richtet sich an Datenwissenschaftler und Statistiker, die bereits grundlegende Kenntnisse in R & C++-Coding sowie R-Code haben und fortgeschrittene R-Coding-Fähigkeiten benötigen.

Das Ziel ist es, den Teilnehmern, die interessiert sind, die Methoden im Beruf anzuwenden, einen praktischen Fortgeschrittenenkurs in R-Programmierung zu bieten.

Branchenspezifische Beispiele werden verwendet, um das Training für die Zielgruppe relevant zu machen

Mehr Informationen...

Statistische Analyse mit SPSS

21 Stunden

Diese von einem Kursleiter geleitete Live-Schulung in Deutschland (online oder vor Ort) richtet sich an Anfänger und Fortgeschrittene, die statistische Analysen mit SPSS durchführen möchten, um Daten genau zu interpretieren, komplexe statistische Tests durchzuführen und aussagekräftige Erkenntnisse zu gewinnen.

Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:

Die SPSS-Oberfläche zu navigieren und Datensätze effizient zu verwalten.
Deskriptive und inferentielle statistische Analysen durchzuführen.
t-Tests, ANOVA, MANOVA, Regressions- und Korrelationsanalysen durchzuführen.
Nicht-parametrische Tests, Hauptkomponentenanalyse und Faktorenanalyse zur erweiterten Dateninterpretation anzuwenden.

Mehr Informationen...

Einführung in die Datenvisualisierung mit Tidyverse und R

7 Stunden

Zielgruppe

Kursformat

Am Ende des Trainings werden die Teilnehmer in der Lage sein:

In diesem unterrichteten und live durchgeführten Kurs lernen die Teilnehmer, wie man Daten mit den Tools aus dem Tidyverse manipuliert und visualisiert.

Der Tidyverse ist eine Sammlung vielseitiger R-Pakete zur Bereinigung, Verarbeitung, Modellierung und Visualisierung von Daten. Einige der enthaltenen Pakete sind: ggplot2, dplyr, tidyr, readr, purrr und tibble.

Anfänger in der R-Sprache
Anfänger im Bereich Datenanalyse und Datavisualisierung

Teil Vorlesung, teil Diskussion, Übungen und intensives Praktikum

Datenanalyse durchführen und ansprechende Visualisierungen erstellen
Nützliche Schlussfolgerungen aus verschiedenen Datensätzen von Beispieldaten ziehen
Daten filtern, sortieren und zusammenfassen, um forschungsorientierte Fragen zu beantworten
Verarbeitete Daten in informatische Linien-, Balken- und Histogramme umwandeln
Daten aus diversen Datensources importieren und filtern, einschließlich Excel, CSV und SPSS-Dateien

Mehr Informationen...

Erstellung von Webanwendungen in R mit Shiny

7 Stunden

Beschreibung:

Dies ist ein Kurs, der R-Nutzern beibringt, wie man Webanwendungen erstellen kann, ohne dass sie sich mit cross-browser HTML, JavaSkript und CSS auskennen müssen.

Ziel:

Der Kurs umfasst die Grundlagen der Funktionsweise von Shiny-Anwendungen.

Es werden alle häufig verwendeten Eingabe/Ausgabe/Rendering/Panel-Funktionen aus der Shiny-Bibliothek behandelt.

Mehr Informationen...

Administratorschulung für Apache Hadoop Schulung

Zielgruppe:

GoVoraussetzungen:

Schulungsübersicht

1: HDFS (17%)

2: YARN und MapReduce Version 2 (MRv2) (17%)

3: Hadoop Cluster Planung (16%)

4: Hadoop Cluster Installation und Verwaltung (25%)

5: RessourcenManagement (10%)

6: Überwachung und Logging (15%)

Voraussetzungen

Erfahrungsberichte (3)

Jacek Pieczatka

Kurs - Administrator Training for Apache Hadoop

Grzegorz Gorski

Kurs - Administrator Training for Apache Hadoop

Simon Hahn

Kurs - Administrator Training for Apache Hadoop

Kommende Kurse

Administratorschulung für Apache Hadoop

Administratorschulung für Apache Hadoop

Administratorschulung für Apache Hadoop

Administratorschulung für Apache Hadoop

Verwandte Kategorien

Diese Seite in anderen Ländern/Regionen

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites