Schulungsübersicht

spark.mllib: Datentypen, Algorithmen und Dienstprogramme

    Datentypen: Grundlegende Statistiken, zusammenfassende Statistiken, Korrelationen, geschichtete Stichproben, Hypothesentests, Streaming-Signifikanztests, zufällige Datengenerierung
Klassifizierung und Regression linearer Modelle (SVMs, logistische Regression, lineare Regression)
  • naiver Bayes
  • Entscheidungsbäume
  • Ensembles von Bäumen (Random Forests und Gradient-Boosted Trees)
  • isotonische Regression
  • Kollaborative Filterung alternierender kleinster Quadrate (ALS)
  • Clustering von k-Mitteln
  • Gaußsche Mischung
  • Power-Iteration-Clustering (PIC)
  • latente Dirichlet-Zuteilung (LDA)
  • k-Mittel halbieren
  • Streaming von K-Mitteln
  • Dimensionsreduktion Singularwertzerlegung (SVD)
  • Hauptkomponentenanalyse (PCA)
  • Merkmalsextraktion und -transformation
  • Häufiges Pattern-Mining-FP-Wachstum
  • Vereinsregeln
  • PräfixSpan
  • Bewertungsmetriken
  • PMML-Modellexport
  • Optimierung (Entwickler) stochastischer Gradientenabstieg
  • BFGS mit begrenztem Speicher (L-BFGS)
  • spark.ml: High-Level-APIs für ML-Pipelines
  • Übersicht: Schätzer, Transformatoren und Pipelines. Extrahieren, Transformieren und Auswählen von Features. Klassifizierung und Regression. Clustering. Fortgeschrittene Themen

    Voraussetzungen

    Kenntnisse in einem der folgenden Bereiche:

    • Java
    • Scala
    • Python
    • SparkR
      35 Stunden

    Teilnehmerzahl



    Preis je Teilnehmer

    Erfahrungsberichte (8)

    Kombinierte Kurse

    Verwandte Kategorien