Main Content

Verstärkungslernen

Ausbildung von Agenten in tiefen neuronalen Netzen durch Interaktion mit einer unbekannten dynamischen Umgebung

Verstärkungslernen ist ein zielgerichteter Berechnungsansatz, bei dem ein Agent durch Interaktion mit einer unbekannten dynamischen Umgebung lernt, eine Aufgabe zu erfüllen. Während des Trainings aktualisiert der Lernalgorithmus die Parameter der Agentenstrategie. Das Ziel des Lernalgorithmus ist es, eine optimale Strategie oder Richtlinie (policy) zu finden, die die langfristige Belohnung während der Aufgabe maximiert.

Je nach Art des Agenten wird die Strategie durch eine oder mehrere Repräsentationen von Strategie und Wertfunktionen dargestellt. Sie können diese Darstellungen mithilfe von tiefen neuronalen Netzen implementieren. Sie können diese Netze dann mithilfe der Software aus der Reinforcement Learning Toolbox™ trainieren.

Weitere Informationen finden Sie unter Reinforcement Learning Using Deep Neural Networks.

Themen