Schulungsübersicht
Einführung
- Lernen durch positive Verstärkung
Elemente von Reinforcement Learning
Wichtige Begriffe (Aktionen, Zustände, Belohnungen, Politik, Wert, Q-Wert, usw.)
Überblick über tabellarische Lösungsmethoden
Erstellen eines Software-Agenten
Verständnis von wertorientierten, politikorientierten und modellorientierten Ansätzen
Arbeiten mit dem Markov-Entscheidungsprozess (MDP)
Wie Policen das Verhalten eines Agenten definieren
Verwendung von Monte-Carlo-Methoden
Lernen mit Zeitdifferenzen
n-Schritt Bootstrapping
Näherungsweise Lösungsmethoden
On-Policy-Vorhersage mit Approximation
On-Policy-Kontrolle mit Approximation
Off-Policy-Methoden mit Approximation
Verstehen von Berechtigungsverläufen
Verwendung von Gradientenmethoden für die Politik
Zusammenfassung und Schlussfolgerung
Voraussetzungen
- Erfahrungen mit maschinellem Lernen
- Programming Erfahrung
Publikum
- Datenwissenschaftler