Schulungsübersicht

Einführung

Verstehen Big Data

Überblick über Spark

Überblick über Python

Überblick über PySpark

  • Verteilen von Daten mit dem Resilient Distributed Datasets Framework
  • Verteilen von Berechnungen mithilfe von Spark-API-Operatoren

Einrichten von Python mit Spark

Einrichten von PySpark

Verwendung von Amazon Web Services (AWS) EC2-Instanzen für Spark

Einrichten von Databricks

Einrichten des AWS EMR-Clusters

Erlernen der Grundlagen von Python Programming

  • Erste Schritte mit Python
  • Verwenden des Jupyter-Notebooks
  • Verwendung von Variablen und einfachen Datentypen
  • Arbeiten mit Listen
  • if-Anweisungen verwenden
  • Benutzereingaben verwenden
  • Arbeiten mit while-Schleifen
  • Funktionen implementieren
  • Arbeiten mit Klassen
  • Arbeiten mit Dateien und Ausnahmen
  • Arbeiten mit Projekten, Daten und APIs

Lernen der Grundlagen von Spark DataFrame

  • Erste Schritte mit Spark DataFrames
  • Implementieren grundlegender Operationen mit Spark
  • Verwenden von Groupby- und Aggregat-Operationen
  • Arbeiten mit Zeitstempeln und Daten

Arbeiten an einem Spark DataFrame-Projekt - Übung

Verstehen von Machine Learning mit MLlib

Arbeiten mit MLlib, Spark und Python für Machine Learning

Verstehen von Regressionen

  • Erlernen der linearen Regressionstheorie
  • Implementieren eines Regressionsauswertungscodes
  • Arbeiten an einer Beispielübung zur linearen Regression
  • Erlernen der logistischen Regressionstheorie
  • Implementieren eines Codes für logistische Regression
  • Arbeiten an einer Beispielübung zur logistischen Regression

Verstehen von Random Forests und Entscheidungsbäumen

  • Theorie der Baummethoden lernen
  • Implementieren von Entscheidungsbäumen und Random Forest-Codes
  • Arbeiten an einer Random Forest-Klassifizierungsübung

Arbeiten mit K-means Clustering

  • Verstehen der K-means Clustering Theorie
  • Implementieren eines K-means Clustering Codes
  • Arbeiten an einer beispielhaften Clustering-Übung

Arbeiten mit Recommender Systems

Natürliche Sprachverarbeitung implementieren

  • Verstehen Natural Language Processing (NLP)
  • Überblick über NLP-Tools
  • Arbeiten an einer NLP-Beispielübung

Streaming mit Spark auf Python

  • Übersicht Streaming mit Spark
  • Beispielhafte Spark Streaming-Übung

Schlussbemerkungen

Voraussetzungen

  • Allgemeine Programmierkenntnisse

Publikum

  • Entwickler
  • IT-Fachleute
  • Datenwissenschaftler
  21 Stunden
 

Teilnehmerzahl


Beginnt

Endet


Die Termine sind abhängig von der Verfügbarkeit und finden zwischen 09:30 und 16:30 statt.
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.

Erfahrungsberichte (5)

Kombinierte Kurse

Verwandte Kategorien