Schulungsübersicht
Einführung in das maschinelle Lernen
- Arten des maschinellen Lernens – überwacht vs. nicht überwacht
 - Von der statistischen Lernmethode zum maschinellen Lernen
 - Der Data-Mining-Arbeitsablauf: Geschäftsverständnis, Datenbereitstellung, Modellierung, Bereitstellung
 - Wahl des richtigen Algorithmus für die Aufgabe
 - Überanpassung und der Bias-Variance-Tradeoff
 
Überblick über Python und ML-Bibliotheken
- Warum Programmiersprachen für das maschinelle Lernen verwendet werden
 - Wahl zwischen R und Python
 - Einführung in Python und Jupyter-Notebooks
 - Python-Bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn
 
Testen und Evaluieren von ML-Algorithmen
- Generalisierung, Überanpassung und Modellvalidierung
 - Evaluierungsstrategien: Holdout, Kreuzvalidierung, Bootstrapping
 - Metriken für die Regression: ME, MSE, RMSE, MAPE
 - Metriken für Klassifikation: Genauigkeit, Verwirrungsmatrix, unbalancierte Klassen
 - Modellleistung visualisieren: Profitkurve, ROC-Kurve, Lift-Kurve
 - Modellauswahl und Grid-Search für die Optimierung
 
Datenbereitstellung
- Datenimport und -speicherung in Python
 - Explorative Analyse und Zusammenfassungsstatistiken
 - Behandlung fehlender Werte und Ausreißer
 - Standardisierung, Normalisierung und Transformation
 - Umwandlung qualitativer Daten und Datenverarbeitung mit pandas
 
Klassifikationsalgorithmen
- Binäre vs. multiklassen-Klassifikation
 - Logistische Regression und Diskriminanzfunktionen
 - Naive Bayes, k-nearest neighbors
 - Entscheidungsbaumverfahren: CART, Random Forests, Bagging, Boosting, XGBoost
 - Support Vector Machines und Kerne
 - Ensemble-Lernmethoden
 
Regression und numerische Vorhersage
- Methode der kleinsten Quadrate und Variablenselektion
 - Regularisierungsmethoden: L1, L2
 - Polynomielle Regression und nichtlineare Modelle
 - Regressionsbäume und Splines
 
Neuronale Netze
- Einführung in neuronale Netze und Deep Learning
 - Aktivierungsfunktionen, Schichten und Backpropagation
 - Multilayer Perceptrons (MLP)
 - Verwendung von TensorFlow oder PyTorch für grundlegende neuronale Netzwerkbildung
 - Neuronale Netze für Klassifikation und Regression
 
Umsatzprognose und prädiktive Analyse
- Zeitreihenanalyse vs. regressionsbasierte Prognose
 - Verarbeitung saisonaler und trendbasierter Daten
 - Erstellung eines Umsatzprognosemodells mit ML-Techniken
 - Bewertung der Prognosegenauigkeit und Unsicherheit
 - Geschäftliche Interpretation und Kommunikation der Ergebnisse
 
Unüberwachtes Lernen
- Clustering-Techniken: k-means, k-medoids, hierarchisches Clustering, SOMs
 - Dimensionsreduktion: PCA, Faktorenanalyse, SVD
 - Multidimensionale Skalierung
 
Textmining
- Textvorverarbeitung und Tokenisierung
 - Bag-of-Words, Stammformbildung (Stemming) und Lemmatisierung
 - Sentimentanalyse und Wortfrequenz
 - Visualisierung von Textdaten mit Word Clouds
 
Empfehlungssysteme
- User-based und item-based Collaborative Filtering
 - Entwicklung und Evaluierung von Empfehlungs-Engines
 
Assoziationsmustermining
- Häufige Itemsets und Apriori-Algorithmus
 - Market Basket Analysis und Lift Ratio
 
Outlier-Detektion
- Analyse extrem hoher Werte
 - Distanz- und Dichte-basierte Methoden
 - Outlier-Detektion in hochdimensionalen Daten
 
Maschinelles Lernen Case Study
- Verständnis des Geschäftsproblems
 - Datenvorverarbeitung und Feature Engineering
 - Modellauswahl und Parameteroptimierung
 - Evaluierung und Präsentation der Ergebnisse
 - Bereitstellung
 
Zusammenfassung und weitere Schritte
Voraussetzungen
- Grundkenntnisse von Maschinellem Lernen, wie überwachtes und unüberwachtes Lernen
 - Vertrautheit mit Python-Programmierung (Variablen, Schleifen, Funktionen)
 - Erfahrung mit Datenverarbeitung unter Verwendung von Bibliotheken wie pandas oder NumPy ist hilfreich, aber nicht erforderlich
 - Keine vorherige Erfahrung mit fortgeschrittenen Modellierungen oder Neuronalen Netzen erwartet
 
Zielgruppe
- Data Scientists
 - Business Analysts
 - Softwareentwickler und technische Fachkräfte, die mit Daten arbeiten
 
Erfahrungsberichte (2)
das ML-Ekosystem, nicht nur MLFlow sondern auch Optuna, Hyperopt, Docker und Docker-Compose
Guillaume GAUTIER - OLEA MEDICAL
Kurs - MLflow
Maschinelle Übersetzung
Ich habe es sehr genossen, an der Kubeflow Ausbildung teilzunehmen, die ferngesteuert durchgeführt wurde. Diese Ausbildung ermöglichte mir, mein Wissen zu AWS-Diensten, K8s und allen devOps-Tools rund um Kubeflow zu festigen, was die notwendige Grundlage ist, um das Thema angemessen anzugehen. Ich möchte Malawski Marcin für seine Geduld und Professionalität bei der Ausbildung sowie für Tipps zur besten Praxis danken. Malawski attackiert das Thema aus verschiedenen Perspektiven, mit unterschiedlichen Bereitstellungstools Ansible, EKS kubectl, Terraform. Jetzt bin ich definitiv überzeugt, dass ich mich auf dem richtigen Anwendungsgebiet befinde.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kurs - Kubeflow
Maschinelle Übersetzung