Schulungsübersicht

Einführung

  • Lernen durch positive Verstärkung

Elemente von Reinforcement Learning

Wichtige Begriffe (Aktionen, Zustände, Belohnungen, Politik, Wert, Q-Wert, usw.)

Überblick über tabellarische Lösungsmethoden

Erstellen eines Software-Agenten

Verständnis von wertorientierten, politikorientierten und modellorientierten Ansätzen

Arbeiten mit dem Markov-Entscheidungsprozess (MDP)

Wie Policen das Verhalten eines Agenten definieren

Verwendung von Monte-Carlo-Methoden

Lernen mit Zeitdifferenzen

n-Schritt Bootstrapping

Näherungsweise Lösungsmethoden

On-Policy-Vorhersage mit Approximation

On-Policy-Kontrolle mit Approximation

Off-Policy-Methoden mit Approximation

Verstehen von Berechtigungsverläufen

Verwendung von Gradientenmethoden für die Politik

Zusammenfassung und Schlussfolgerung

Voraussetzungen

  • Erfahrungen mit maschinellem Lernen
  • Programming Erfahrung

Publikum

  • Datenwissenschaftler
  21 Stunden
 

Teilnehmerzahl


Beginnt

Endet


Die Termine sind abhängig von der Verfügbarkeit und finden zwischen 09:30 und 16:30 statt.
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.

Kombinierte Kurse

AI and Robotics for Nuclear - Extended

  120 Stunden

AI and Robotics for Nuclear

  80 Stunden

Verwandte Kategorien