Schulungsübersicht
Einführung in das maschinelle Lernen
- Arten des maschinellen Lernens – überwacht vs. unüberwacht
- Von statistischem Lernen zum maschinellen Lernen
- Der Workflow des Datenminings: Geschäftsverständnis, Datenvorbereitung, Modellierung, Bereitstellung
- Auswahl des richtigen Algorithmus für die Aufgabe
- Überanpassung und der Bias-Variance-Kompromiss
Übersicht über Python und ML-Bibliotheken
- Warum Programmiersprachen für das maschinelle Lernen verwendet werden
- Auswahl zwischen R und Python
- Schnellkurs in Python und Jupyter Notebooks
- Python-Bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testen und Evaluieren von ML-Algorithmen
- Verallgemeinerung, Überanpassung und Modellvalidierung
- Evaluationsstrategien: Holdout, Kreuzvalidierung, Bootstrapping
- Metriken für Regression: ME, MSE, RMSE, MAPE
- Metriken für Klassifizierung: Genauigkeit, Verwirrungsmatrix, unbalancierte Klassen
- Modellleistung visualisieren: Profitkurve, ROC-Kurve, Lift-Kurve
- Modellauswahl und Grid-Search zur Feinabstimmung
Datenvorbereitung
- Dateneinfuhr und -speicherung in Python
- Explorative Analyse und Zusammenfassungsstatistiken
- Bearbeitung fehlender Werte und Ausreißer
- Standardisierung, Normalisierung und Transformation
- Kodierung qualitativer Daten und Datenbearbeitung mit pandas
Klassifizierungs-Algorithmen
- Binäre vs. multiklassen Klassifizierung
- Logistische Regression und Diskriminanzfunktionen
- Naive Bayes, k-nächste Nachbarn
- Entscheidungsbaume: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines und Kerne
- Ensemble-Lernverfahren
Regression und numerische Vorhersage
- Kleinste Quadrate und Variablenselektion
- Regularisierungsmethoden: L1, L2
- Polyregression und nichtlineare Modelle
- Regessionstrees und Splines
Unüberwachtes Lernen
- Klusteranalysetechniken: k-means, k-medoids, hierarchische Clustering, SOMs
- Dimensionsreduktion: PCA, Faktorenanalyse, SVD
- Mehrdimensionale Skalierung
Textmining
- Vorverarbeitung von Text und Tokenisierung
- Bag-of-Words, Stammformbildung und Lemmatisierung
- Sentimentanalyse und Wortfrequenz
- Visualisierung von Textdaten mit Word Clouds
Empfehlungssysteme
- Nutzer- und elementbasierte kollaborative Filterung
- Entwurf und Evaluierung von Empfehlungsmotoren
Minen von Assoziationsmustern
- Häufige Itemsets und Apriori-Algorithmus
- Market Basket Analyse und Lift-Verhältnis
Auffälligkeitsdetektion
- Extreme-Wertanalyse
- Distanz- und dichteorientierte Methoden
- Auffälligkeitsdetektion in hochdimensionalen Daten
Fallstudie zum maschinellen Lernen
- Verstehen des Geschäftsproblems
- Datenvorbereitung und Feature Engineering
- Modellauswahl und Parametertuning
- Evaluierung und Präsentation der Ergebnisse
- Bereitstellung
Zusammenfassung und weitere Schritte
Voraussetzungen
- Grundverständnis von Statistik und linearer Algebra
- Bekanntschaft mit Datenanalyse oder Business-Intelligence-Konzepten
- Eine gewisse Erfahrung mit der Programmierung (vorzugsweise Python oder R) wird empfohlen
- Interesse am Lernen von angewandtem Maschinellem Lernen für datengestützte Projekte
Zielgruppe
- Datenanalysten und -wissenschaftler
- Statistiker und Forschungsfachleute
- Entwickler und IT-Professionals, die sich mit Maschinellem Lernen vertraut machen möchten
- Jeder, der an Datenwissenschaft oder prädiktiver Analyse beteiligt ist
Erfahrungsberichte (3)
Trotz des verpassten Tages aufgrund von Kundengesprächen fühle ich mich nun viel sicherer in der Understanding der Prozesse und Techniken, die in maschinellem Lernen eingesetzt werden, sowie darüber, wann ich einen bestimmten Ansatz gegenüber einem anderen bevorzugen sollte. Unsere Herausforderung besteht jetzt darin, das Gelernte zu üben und es auf unser Problemfeld anzuwenden.
Richard Blewett - Rock Solid Knowledge Ltd
Kurs - Machine Learning – Data science
Maschinelle Übersetzung
Mir hat gefallen, dass die Schulung sich auf Beispiele und Programmierung konzentrierte. Ich dachte, es wäre unmöglich, so viel Inhalt in drei Tage zu packen, aber ich lag falsch. Die Schulung behandelte viele Themen und alles wurde sehr detailliert durchgeführt (insbesondere die Feinabstimmung der Modellparameter - damit hatte ich nicht gerechnet und war angenehm überrascht).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurs - Machine Learning – Data science
Maschinelle Übersetzung
Es zeigt viele Methoden mit vorbereiten Skripten – sehr gut aufbereitete Materialien und leicht zu verfolgen.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Kurs - Machine Learning – Data science
Maschinelle Übersetzung