Startseite
Big Data Schulungen
Apache Spark Schulungen
SMACK-Stapel für Data Science Training Course

SMACK-Stapel für Data Science Training Course

SMACK ist eine Sammlung von Datenplattform-Software, nämlich Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, und Apache Kafka. Mit dem SMACK Stack können Benutzer Datenverarbeitungsplattformen erstellen und skalieren.

Dieser Instructor-Leid, Live-Training (online oder on-site) richtet sich an Datenwissenschaftler, die die SMACK Stack verwenden möchten, um Datenverarbeitungsplattformen für Big Data-Lösungen zu bauen.

Am Ende dieser Ausbildung können die Teilnehmer:

Implementieren Sie eine Datenträgerarchitektur für die Verarbeitung großer Daten.
Entwickeln Sie eine Clusterinfrastruktur mit Apache Mesos und Docker.
Analysieren Sie Daten mit Spark und Scala.
Verwaltung unstrukturierter Daten mit Apache Cassandra.

Format des Kurses

Interaktive Unterricht und Diskussion.
Viele Übungen und Übungen.
Hand-on Implementierung in einem Live-Lab-Umfeld.

Kursanpassungsoptionen

Um eine benutzerdefinierte Ausbildung für diesen Kurs zu beantragen, wenden Sie sich bitte an uns, um zu arrangieren.

Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.

Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.

Schulungsübersicht

Einführung

SMACK Stack Übersicht

Was ist Apache Spark? Apache Spark-Funktionen
Was ist Apache Mesos? Apache Mesos-Funktionen
Was ist Apache Akka? Apache Akka-Funktionen
Was ist Apache Cassandra? Apache Cassandra-Merkmale
Was ist Apache Kafka? Apache Kafka-Funktionen

Scala Sprache

Scala Syntax und Struktur
Scala Kontrollfluss

Vorbereiten der Entwicklungsumgebung

Installieren und Konfigurieren des SMACK-Stacks
Installieren und Konfigurieren Docker

Apache Akka

Einsatz von Schauspielern

Apache Cassandra

Erstellen einer Datenbank für Lesevorgänge
Arbeiten mit Backups und Wiederherstellung

Steckverbinder

Erstellen eines Streams
Aufbau einer Akka-Anwendung
Speichern von Daten mit Cassandra
Überprüfen von Konnektoren

Apache Kafka

Arbeiten mit Clustern
Erstellen, Veröffentlichen und Konsumieren von Nachrichten

Apache Mesos

Zuweisung von Ressourcen
Ausführen von Clustern
Arbeiten mit Apache Aurora und Docker
Ausführen von Diensten und Aufträgen
Einsatz von Spark, Cassandra und Kafka auf Mesos

Apache Spark

Verwaltung von Datenflüssen
Arbeiten mit RDDs und Dataframes
Durchführen von Datenanalysen

Fehlersuche

Umgang mit dem Ausfall von Diensten und Fehlern

Zusammenfassung und Schlussfolgerung

Voraussetzungen

Verständnis für Datenverarbeitungssysteme

Publikum

Datenwissenschaftler

14 Stunden

Teilnehmerzahl

Online

Classroom

Schulungsort auswählen

Bitte wählen Sie einen Veranstaltungsort

Price per participant (excl. VAT)

Offene Schulungskurse erfordern mindestens 5 Teilnehmer.

SMACK-Stapel für Data Science Training Course - Booking

Vollständiger Name *

E-Mail *

Telefon *

Job Titel

Firmenname

Adresse 1 *

Stadt *

Bundesland / Region

Land *

Postleitzahl *

Starttermin

Steuer-ID

Dates are subject to availability and take place between 09:30 and 16:30.

Payment *

Banküberweisung (Rechnung, Bestellung)

Debit / Kredit Karte

Kommentare

Veröffentlichung des Zertifikats zulassen

Wenn Sie dieses Kästchen markieren, erhalten die Teilnehmer die Möglichkeit, ihr Kurszertifikat im NobleProg Certified Professional Katalog zu veröffentlichen.

Allgemeine Geschäftsbedingungen *

Ich bin ein bevollmächtigter Vertreter des oben genannten Kunden und möchte die oben genannten Kurse oder Dienstleistungen in Übereinstimmung mit den Allgemeinen Geschäftsbedingungen und der Datenschutzrichtlinie von NobleProg buchen.

Informieren Sie mich über Rabatte und Sonderangebote

Please read our Privacy Policy to find out how we use your data

SMACK-Stapel für Data Science Training Course - Enquiry

Vollständiger Name *

E-Mail *

Telefon *

Teilnehmerzahl

Firmenname

Firmenadresse

Wie möchten Sie den Kurs absolvieren?

Client Premises

Online

Schulungsraum

Kommentare

Informieren Sie mich über Rabatte und Sonderangebote

Please read our Privacy Policy to find out how we use your data

SMACK-Stapel für Data Science - Beratungsanfrage

Beratungsanfrage

Vollständiger Name *

Telefon *

E-Mail *

Firmenname

Thema der Beratung *

Ziel der Beratung

Dauer der Beratung

Anzahl der Berater

Gewünschtes Datum

Mit wem wird der Berater zusammenarbeiten?

Dringlichkeit der Beratung *

Kommentare

Informieren Sie mich über Rabatte und Sonderangebote

Please read our Privacy Policy to find out how we use your data

Erfahrungsberichte (1)

sehr interaktiv...

Richard Langford

Kurs - SMACK Stack for Data Science

3472 EUR (Online)

3872 EUR (Schulungsraum)

Kombinierte Kurse

Künstliche Intelligenz - die am meisten angewandten Dinge - Data Analysis + Verteilte KI + NLP

21 Stunden

Dieses Kurs ist für Entwickler und Datenwissenschaftler gedacht, die künstliche Intelligenz in ihren Anwendungen verstehen und implementieren möchten. Es legt besonderen Fokus auf Datenanalyse, verteilte KI und Natural Language Processing.

Anaconda-Ökosystem für Datenwissenschaftler

14 Stunden

Diese von einem Dozenten geleitete Live-Schulung in Deutschland (online oder vor Ort) richtet sich an Datenwissenschaftler, die das Anaconda-Ökosystem zur Erfassung, Verwaltung und Bereitstellung von Paketen und Datenanalyse-Workflows auf einer einzigen Plattform nutzen möchten.

Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:

Anaconda-Komponenten und -Bibliotheken zu installieren und zu konfigurieren.
Die Kernkonzepte, Funktionen und Vorteile von Anaconda zu verstehen.
Pakete, Umgebungen und Kanäle mit Anaconda Navigator zu verwalten.
Conda, R und Python Pakete für Data Science und maschinelles Lernen verwenden.
Sie lernen einige praktische Anwendungsfälle und Techniken für die Verwaltung mehrerer Datenumgebungen kennen.

Big Data Business Intelligence for Telecom & Communication Service Providers

35 Stunden

Überblick

Communications Service Provider (CSP) stehen unter Druck, um die Kosten zu senken und das durchschnittliche Einkommen pro Benutzer (ARPU) zu maximieren, während eine ausgezeichnete Kundenerfahrung gewährleistet wird, aber Datenvolumen weiter wachsen. Der weltweite mobile Datenverkehr wird bei einer kombinierten jährlichen Wachstumsrate (CAGR) von 78 Prozent bis 2016 auf 10,8 exabytes pro Monat wachsen.

Währenddessen generieren CSPs große Datenvolumen, einschließlich Call Details Records (CDR), Netzwerkdaten und Kundendaten. Unternehmen, die diese Daten vollumfänglich nutzen, gewinnen einen wettbewerbsfähigen Rand. Laut einer jüngsten Umfrage der The Economist Intelligence Unit genießen Unternehmen, die Datenorientierte Entscheidungsfindung nutzen, eine Produktivitätserhöhung von 5-6%. Doch 53% der Unternehmen nutzen nur die Hälfte ihrer wertvollen Daten, und ein Viertel der Befragten bemerkte, dass große Mengen nützlicher Daten unvergesslich sind. Die Datenvolume sind so hoch, dass manuelle Analyse unmöglich ist, und die meisten Legacy-Software-Systeme können nicht aufrechterhalten, was zu wertvollen Daten führt, die abgelehnt oder ignoriert werden.

Mit Big Data & Analytics’ High-Speed, scalable Big Data-Software können CSPs alle ihre Daten für bessere Entscheidungsfindung in weniger Zeit minieren. Verschiedene Big Data Produkte und Techniken bieten eine End-to-End-Software-Plattform für die Sammlung, Vorbereitung, Analyse und Präsentation von Einsichten aus großen Daten. Anwendungsbereiche umfassen Netzwerkleistungsüberwachung, Betrugdetektion, Kundenschurndetektion und Kreditrisikoanalyse. Big Data & Analytics-Produkte schaal, um Terabytes von Daten zu verarbeiten, aber die Implementierung solcher Tools erfordert eine neue Art von Cloud-basiertes Datenbank-System wie Hadoop oder massive schaal parallele Computing-Prozessor (KPU usw.)

Dieser Kurs arbeitet auf Big Data BI für Telco umfasst alle aufstrebenden neuen Bereiche, in denen CSPs für Produktivitätsgewinnung und die Eröffnung neuer Geschäftsausgabenströme investieren. Der Kurs bietet eine vollständige 360 Grad Überblick Big Data BI in Telco, so dass Entscheidungsträger und Manager eine sehr breite und umfassende Überblick über die Möglichkeiten Big Data BI in Telco für Produktivität und Einkommensgewinnung haben können.

Kursziele

Das Hauptziel des Kurses ist es, neue Big Data Business Intelligence-Techniken in 4 Sektoren Telecom Business (Marketing/Sales, Network Operation, Financial Operation und Customer Relation Management) einzuführen. Die Studierenden werden eingeführt, um zu folgen:

Einführung zu Big Data-was ist 4Vs (Volumen, Geschwindigkeit, Vielfalt und Wahrscheinlichkeit) in Big Data- Generation, Extraction und Management aus Telco Perspektive
Wie Big Data Analytik unterscheidet sich von Erbe-Datenanalytik
In-house Begründung von Big Data -Telco Perspektive
Einführung in Hadoop Ökosystem- Bekanntschaft mit allen Hadoop Tools wie Hive, Pig, SPARC –Wenn und wie sie verwendet werden, um das Problem zu lösen Big Data
Wie Big Data zur Analyse für Analyse-Tool-Wie Business Analysis’s können ihre Schmerzpunkte der Sammlung und Analyse von Daten durch integrierte Hadoop Dashboard-Ansatz reduzieren
Grundlegende Einführung in Insight-Analysen, Visualisierungsanalysen und Predictive-Analysen für Telco
Customer Churn-Analytics und Big Data-how Big Data-Analytics können Customer Churn und Kundenunzufriedenheit in Telco-Case-Studien reduzieren
Netzwerkfehler- und Servicefehleranalyse aus Netzwerkmetadata und IPDR
Finanzanalyse - Betrug, Wastage und ROI-Schätzung aus Verkaufs- und Betriebsdaten
Kundenaufnahme-Problem-Zielmarketing, Kundensegmentation und Cross-Sales von Verkaufsdaten
Einführung und Zusammenfassung aller Big Data analytischen Produkte und wo sie in den analytischen Raum von Telco passen
Schlussfolgerung - wie man Schritt für Schritt einen Ansatz zur Einführung Big Data Business Intelligence in Ihre Organisation einnehmen kann

Zielgruppe

Netzwerkverkehr, Finanzmanager, CRM-Manager und Top-IT-Manager im Telco CIO-Büro.
Business Analytiker in Telco
CFO Büro-Manager / Analysten
Operationsmanager
QA Manager

Datenwissenschaft für Big Data Analytik

35 Stunden

Big Data sind Datenmengen, die so umfangreich und komplex sind, dass herkömmliche Anwendungssoftware für die Datenverarbeitung nicht ausreicht, um mit ihnen umzugehen. Zu den großen Datenherausforderungen gehören Datenerfassung, Datenspeicherung, Datenanalyse, Suche, Freigabe, Übertragung, Visualisierung, Abfrage, Aktualisierung und Datenschutz.

Data Science unerlässlich für Marketing/Verkaufsprofis

21 Stunden

Dieser Kurs richtet sich an Marketing Vertriebsprofis, die tiefer in die Anwendung von Data Science im Marketing/Vertrieb einsteigen möchten. Der Kurs bietet eine detaillierte Abdeckung verschiedener datenwissenschaftlicher Techniken, die für „Upsale“, „Cross-Sale“, Marktsegmentierung, Branding und CLV verwendet werden.

Unterschied zwischen Marketing und Vertrieb – Wie unterscheiden sich Vertrieb und Marketing?

In sehr einfachen Worten kann Verkauf als ein Prozess bezeichnet werden, der sich auf Einzelpersonen oder kleine Gruppen konzentriert oder darauf abzielt. Marketing hingegen richtet sich an eine größere Gruppe bzw. die breite Öffentlichkeit. Marketing umfasst Forschung (Identifizierung der Bedürfnisse des Kunden), Entwicklung von Produkten (Herstellung innovativer Produkte) und Werbung für das Produkt (durch Werbung) sowie die Schaffung eines Bewusstseins für das Produkt bei den Verbrauchern. Marketing bedeutet also die Generierung von Leads oder Interessenten. Sobald das Produkt auf dem Markt ist, ist es die Aufgabe des Verkäufers, den Kunden zum Kauf des Produkts zu bewegen. Beim Verkauf geht es darum, Leads oder Interessenten in Käufe und Bestellungen umzuwandeln, während das Marketing auf längere Fristen abzielt, bezieht sich der Verkauf auf kürzere Ziele.

Einführung in Graph Computing

28 Stunden

In dieser von einem Trainer geleiteten Live-Schulung in Deutschland lernen die Teilnehmer die Technologieangebote und Implementierungsansätze für die Verarbeitung von Graphdaten kennen. Ziel ist es, Objekte der realen Welt, ihre Eigenschaften und Beziehungen zu identifizieren, diese Beziehungen zu modellieren und sie als Daten mit einem Graph Computing (auch bekannt als Graph Analytics) Ansatz zu verarbeiten. Wir beginnen mit einem breiten Überblick und konzentrieren uns auf spezifische Tools, während wir eine Reihe von Fallstudien, praktischen Übungen und Live-Einsätzen durchführen.

Am Ende dieser Schulung werden die Teilnehmer in der Lage sein

Verstehen, wie Graphdaten persistiert und durchlaufen werden.
das beste Framework für eine bestimmte Aufgabe auszuwählen (von Graphdatenbanken bis hin zu Stapelverarbeitungs-Frameworks).
Implementierung von Hadoop, Spark, GraphX und Pregel, um Graphenberechnungen auf vielen Rechnern parallel durchzuführen.
Big-Data-Probleme aus der realen Welt in Form von Graphen, Prozessen und Traversalen zu betrachten.

Jupyter für Data Science Teams

7 Stunden

Dieser von einem Trainer geleitete Live-Workshop (online oder vor Ort) führt in das Konzept der kollektiven Entwicklung im Bereich Data Science ein und zeigt, wie Jupyter zum Verfolgen und Teilnehmen am "Lebenszyklus eines berechnungsbasierten Ideen" als Team verwendet werden kann. Dabei wird den Teilnehmern die Erstellung eines Beispiels für einen Datenwissenschaft-Projekt auf der Grundlage des Jupyter-Ekosystems vorgestellt.

Am Ende dieses Trainings werden die Teilnehmer in der Lage sein, Folgendes zu tun:

Jupyter zu installieren und einzurichten, einschließlich der Erstellung und Integration eines Team-Repositories auf Git.
Mit Funktionen von Jupyter wie Erweiterungen, interaktiven Widgets, Multiuser-Modus und mehr Projekte zur Zusammenarbeit zu ermöglichen.
Jupyter Notebooks mit Teammitgliedern zu erstellen, freizugeben und zu organisieren.
Scala, Python, R auszuwählen, um Code gegen Big Data Systeme wie Apache Spark über die Jupyter-Schnittstelle zu schreiben und auszuführen.

Kaggle

14 Stunden

Diese von einem Dozenten geleitete Live-Schulung in Deutschland (online oder vor Ort) richtet sich an Datenwissenschaftler und -entwickler, die Data Science mit Kaggle erlernen und ihre Karriere ausbauen möchten.

Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:

Über Datenwissenschaft und maschinelles Lernen lernen.
Datenanalytik erforschen.
Lernen Sie über Kaggle und wie es funktioniert.

MATLAB-Grundlagen, Data Science & Berichterstellung

35 Stunden

Im ersten Teil dieser Schulung behandeln wir die Grundlagen von MATLAB und seine Funktion als Sprache und Plattform. Dazu gehört eine Einführung in die MATLAB-Syntax, Arrays und Matrizen, Datenvisualisierung, Skriptentwicklung und objektorientierte Prinzipien.

Im zweiten Teil wird gezeigt, wie MATLAB für Data Mining, maschinelles Lernen und prädiktive Analysen verwendet werden kann. Um den Teilnehmern eine klare und praktische Perspektive des Ansatzes und der Leistungsfähigkeit von MATLAB zu vermitteln, ziehen wir Vergleiche zwischen der Verwendung von MATLAB und der Verwendung anderer Tools wie Tabellenkalkulationen, C, C++ und Visual Basic.

Im dritten Teil der Schulung lernen die Teilnehmer, wie sie ihre Arbeit durch Automatisierung der Datenverarbeitung und Berichterstellung rationalisieren können.

Während des gesamten Kurses werden die Teilnehmer die erlernten Ideen durch praktische Übungen in einer Laborumgebung in die Praxis umsetzen. Am Ende des Kurses werden die Teilnehmer die Möglichkeiten von MATLAB genau kennen und in der Lage sein, sie zur Lösung realer Data-Science-Probleme sowie zur Rationalisierung ihrer Arbeit durch Automatisierung einzusetzen.

Während des gesamten Kurses werden Beurteilungen durchgeführt, um den Fortschritt zu messen.

Format des Kurses

Der Kurs umfasst theoretische und praktische Übungen, einschließlich Falldiskussionen, Code-Beispielen und praktischer Implementierung.

Hinweis

Die praktischen Übungen werden auf der Grundlage von vorab vereinbarten Musterdatenberichten durchgeführt. Wenn Sie spezielle Anforderungen haben, kontaktieren Sie uns bitte, um dies zu vereinbaren.

Beschleunigung Python von Pandas-Workflows mit Modin

14 Stunden

Diese von einem Trainer geleitete Live-Schulung in Deutschland (online oder vor Ort) richtet sich an Datenwissenschaftler und Entwickler, die Modin verwenden möchten, um parallele Berechnungen mit Pandas für eine schnellere Datenanalyse zu erstellen und zu implementieren.

Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:

die notwendige Umgebung einzurichten, um mit der Entwicklung von Pandas-Workflows in großem Maßstab mit Modin zu beginnen.
die Funktionen, die Architektur und die Vorteile von Modin zu verstehen.
Die Unterschiede zwischen Modin, Dask und Ray kennen.
Schnellere Durchführung von Pandas-Vorgängen mit Modin.
Implementierung der gesamten Pandas API und Funktionen.

Python Programming für Finanzen

35 Stunden

Python ist eine Programmiersprache, die in der Finanzbranche große Popularität erlangt hat. Angenommen von den größten Investmentbanken und Hedgefonds, wird es verwendet, um eine breite Palette von Finanzanwendungen aufzubauen, die von Kernhandelsprogrammen bis hin zu Risikomanagementsystemen reichen.

In diesem von Lehrern geleiteten Live-Training lernen die Teilnehmer, wie sie mit Python praktische Anwendungen zur Lösung einer Reihe spezifischer finanzbezogener Probleme entwickeln.

Am Ende dieser Schulung können die Teilnehmer:

Die Grundlagen der Python-Programmiersprache verstehen
Die besten Entwicklungstools zum Erstellen von Finanzanwendungen in Python herunterladen, installieren und warten
Geeignete Python-Pakete und Programmiertechniken auswählen und nutzen, um Finanzdaten aus verschiedenen Quellen (CSV, Excel, Datenbanken, Web usw.) zu organisieren, zu visualisieren und zu analysieren
Anwendungen entwickeln, die Probleme im Zusammenhang mit Asset Allocation, Risikoanalyse, Investment Performance und mehr lösen
Eine Python-Anwendung beheben, integrieren, bereitstellen und optimieren

Publikum

Entwickler
Analysten
Quants

Format des Kurses

Teil Vortrag, Teil Diskussion, Übungen und intensive praktische Anwendung

Hinweis

Dieses Training zielt darauf ab, Lösungen für einige der Hauptprobleme zu bieten, mit denen Finanzexperten konfrontiert sind. Wenn Sie jedoch ein bestimmtes Thema, Tool oder eine bestimmte Technik haben, die Sie vertiefen oder weiter ausführen möchten, kontaktieren Sie uns bitte, um dies zu vereinbaren.

GPU-Datenwissenschaft mit NVIDIA RAPIDS

14 Stunden

Diese von einem Dozenten geleitete Live-Schulung in Deutschland (online oder vor Ort) richtet sich an Datenwissenschaftler und Entwickler, die RAPIDS nutzen möchten, um GPU-beschleunigte Datenpipelines, Workflows und Visualisierungen zu erstellen und dabei Algorithmen des maschinellen Lernens wie XGBoost, cuML usw. anzuwenden.

Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:

Einrichten der erforderlichen Entwicklungsumgebung zur Erstellung von Datenmodellen mit NVIDIA RAPIDS.
Die Funktionen, Komponenten und Vorteile von RAPIDS zu verstehen.
Nutzung von GPU zur Beschleunigung von End-to-End-Daten- und Analysepipelines.
Implementierung von GPU-beschleunigter Datenvorbereitung und ETL mit cuDF und Apache Arrow.
Lernen Sie, wie Sie maschinelle Lernaufgaben mit XGBoost- und cuML-Algorithmen durchführen können.
Erstellen Sie Datenvisualisierungen und führen Sie Graphanalysen mit cuXfilter und cuGraph durch.

Python und Spark für Big Data (PySpark)

21 Stunden

In dieser von einem Trainer geleiteten Live-Schulung in Deutschland lernen die Teilnehmer anhand praktischer Übungen, wie sie Python und Spark gemeinsam zur Analyse von Big Data einsetzen können.

Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:

Lernen, wie man Spark mit Python verwendet, um Big Data zu analysieren.
An Übungen arbeiten, die reale Fälle nachahmen.
Verschiedene Tools und Techniken für die Big-Data-Analyse mit PySpark verwenden.

Apache Spark MLlib

35 Stunden

MLlib ist die ML-Bibliothek (Machine Learning) von Spark. Ziel ist es, praktisches maschinelles Lernen skalierbar und einfach zu machen. Es besteht aus allgemeinen Lernalgorithmen und Dienstprogrammen, einschließlich Klassifizierung, Regression, Clustering, kollaborativer Filterung, Dimensionsreduzierung sowie Optimierungsprimitiven auf niedrigerer Ebene und Pipeline-APIs auf höherer Ebene.

Es teilt sich in zwei Pakete:

spark.mllib enthält die ursprüngliche API, die auf RDDs basiert.
spark.ml bietet eine API auf höherer Ebene, die auf DataFrames zum Erstellen von ML-Pipelines basiert.

Publikum

Dieser Kurs richtet sich an Ingenieure und Entwickler, die eine integrierte Maschinenbibliothek für Apache Spark

Stratio: Rocket und Intelligence Module mit PySpark

14 Stunden

Stratio ist eine datenzentrierte Plattform, die Big Data, KI und Governance in ein einziges Lösungsprodukt integriert. Die Module Rocket und Intelligence ermöglichen eine schnelle Datenexploration, Transformation und erweiterte Analysen in Unternehmensumgebungen.

Dieser von einem Dozenten geleitete Live-Kurs (online oder vor Ort) richtet sich an fortgeschrittene Datenprofessionals, die die Module Rocket und Intelligence effektiv mit PySpark nutzen möchten. Der Schwerpunkt liegt auf Schleifenstrukturen, benutzerdefinierten Funktionen und erweiterten Datenlogiken.

Am Ende dieses Trainings werden die Teilnehmer in der Lage sein:

In der Stratio-Plattform mithilfe der Module Rocket und Intelligence zu navigieren und zu arbeiten.
PySpark im Kontext von Datenimport, Transformation und Analyse anzuwenden.
Schleifen und bedingte Logiken zur Steuerung von Datenaufgaben und Merkmalsingenieurprozessen zu verwenden.
Benutzerdefinierte Funktionen (UDFs) für wiederverwendbare Datenoperationen in PySpark zu erstellen und zu verwalten.

Format des Kurses

Interaktive Vorlesung und Diskussion.
Viele Übungen und Praxis.
Hands-on-Implementierung in einer live-Lab-Umgebung.

Optionen zur Anpassung des Kurses

Bei Interesse an einer angepassten Ausbildung für diesen Kurs, kontaktieren Sie uns bitte, um eine Anfrage zu stellen.

SMACK-Stapel für Data Science Training Course

Schulungsübersicht

Voraussetzungen

Erfahrungsberichte (1)

Richard Langford

Kurs - SMACK Stack for Data Science

Kommende Kurse

SMACK-Stapel für Data Science

SMACK-Stapel für Data Science

SMACK-Stapel für Data Science

SMACK-Stapel für Data Science

SMACK-Stapel für Data Science

Verwandte Kategorien

Diese Seite in anderen Ländern/Regionen

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites