Schulungsübersicht
Einführung in das maschinelle Lernen
- Arten des maschinellen Lernens – überwacht vs. nicht überwacht
- Von der statistischen Lernmethode zum maschinellen Lernen
- Der Data-Mining-Arbeitsablauf: Geschäftsverständnis, Datenbereitstellung, Modellierung, Bereitstellung
- Wahl des richtigen Algorithmus für die Aufgabe
- Überanpassung und der Bias-Variance-Tradeoff
Überblick über Python und ML-Bibliotheken
- Warum Programmiersprachen für das maschinelle Lernen verwendet werden
- Wahl zwischen R und Python
- Einführung in Python und Jupyter-Notebooks
- Python-Bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testen und Evaluieren von ML-Algorithmen
- Generalisierung, Überanpassung und Modellvalidierung
- Evaluierungsstrategien: Holdout, Kreuzvalidierung, Bootstrapping
- Metriken für die Regression: ME, MSE, RMSE, MAPE
- Metriken für Klassifikation: Genauigkeit, Verwirrungsmatrix, unbalancierte Klassen
- Modellleistung visualisieren: Profitkurve, ROC-Kurve, Lift-Kurve
- Modellauswahl und Grid-Search für die Optimierung
Datenbereitstellung
- Datenimport und -speicherung in Python
- Explorative Analyse und Zusammenfassungsstatistiken
- Behandlung fehlender Werte und Ausreißer
- Standardisierung, Normalisierung und Transformation
- Umwandlung qualitativer Daten und Datenverarbeitung mit pandas
Klassifikationsalgorithmen
- Binäre vs. multiklassen-Klassifikation
- Logistische Regression und Diskriminanzfunktionen
- Naive Bayes, k-nearest neighbors
- Entscheidungsbaumverfahren: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines und Kerne
- Ensemble-Lernmethoden
Regression und numerische Vorhersage
- Methode der kleinsten Quadrate und Variablenselektion
- Regularisierungsmethoden: L1, L2
- Polynomielle Regression und nichtlineare Modelle
- Regressionsbäume und Splines
Neuronale Netze
- Einführung in neuronale Netze und Deep Learning
- Aktivierungsfunktionen, Schichten und Backpropagation
- Multilayer Perceptrons (MLP)
- Verwendung von TensorFlow oder PyTorch für grundlegende neuronale Netzwerkbildung
- Neuronale Netze für Klassifikation und Regression
Umsatzprognose und prädiktive Analyse
- Zeitreihenanalyse vs. regressionsbasierte Prognose
- Verarbeitung saisonaler und trendbasierter Daten
- Erstellung eines Umsatzprognosemodells mit ML-Techniken
- Bewertung der Prognosegenauigkeit und Unsicherheit
- Geschäftliche Interpretation und Kommunikation der Ergebnisse
Unüberwachtes Lernen
- Clustering-Techniken: k-means, k-medoids, hierarchisches Clustering, SOMs
- Dimensionsreduktion: PCA, Faktorenanalyse, SVD
- Multidimensionale Skalierung
Textmining
- Textvorverarbeitung und Tokenisierung
- Bag-of-Words, Stammformbildung (Stemming) und Lemmatisierung
- Sentimentanalyse und Wortfrequenz
- Visualisierung von Textdaten mit Word Clouds
Empfehlungssysteme
- User-based und item-based Collaborative Filtering
- Entwicklung und Evaluierung von Empfehlungs-Engines
Assoziationsmustermining
- Häufige Itemsets und Apriori-Algorithmus
- Market Basket Analysis und Lift Ratio
Outlier-Detektion
- Analyse extrem hoher Werte
- Distanz- und Dichte-basierte Methoden
- Outlier-Detektion in hochdimensionalen Daten
Maschinelles Lernen Case Study
- Verständnis des Geschäftsproblems
- Datenvorverarbeitung und Feature Engineering
- Modellauswahl und Parameteroptimierung
- Evaluierung und Präsentation der Ergebnisse
- Bereitstellung
Zusammenfassung und weitere Schritte
Voraussetzungen
- Grundkenntnisse von Maschinellem Lernen, wie überwachtes und unüberwachtes Lernen
- Vertrautheit mit Python-Programmierung (Variablen, Schleifen, Funktionen)
- Erfahrung mit Datenverarbeitung unter Verwendung von Bibliotheken wie pandas oder NumPy ist hilfreich, aber nicht erforderlich
- Keine vorherige Erfahrung mit fortgeschrittenen Modellierungen oder Neuronalen Netzen erwartet
Zielgruppe
- Data Scientists
- Business Analysts
- Softwareentwickler und technische Fachkräfte, die mit Daten arbeiten
Erfahrungsberichte (3)
Mir hat besonders der Schluss gefallen, als wir die Zeit nahmen, mit CHAT GPT herumzuspielen. Der Raum war dafür jedoch nicht optimal eingerichtet – anstelle eines großen Tisches wären ein paar kleinere Tische nützlicher gewesen, damit wir in kleinen Gruppen zusammenkommen und brainstormen könnten.
Nola - Laramie County Community College
Kurs - Artificial Intelligence (AI) Overview
Maschinelle Übersetzung
Nach grundlegenden Prinzipien arbeiten und sich innerhalb desselben Tages auf die Anwendung von Fallstudien konzentrieren
Maggie Webb - Department of Jobs, Regions, and Precincts
Kurs - Artificial Neural Networks, Machine Learning, Deep Thinking
Maschinelle Übersetzung
Dass es reale Firmendaten verwendete. Der Trainer hatte einen sehr guten Ansatz, indem er die Teilnehmer aktiv einbezog und sie miteinander wetteifern ließ.
Jimena Esquivel - Zaklad Uslugowy Hakoman Andrzej Cybulski
Kurs - Applied AI from Scratch in Python
Maschinelle Übersetzung