Verstärkungslernen
Verstärkungslernen ist ein zielgerichteter Berechnungsansatz, bei dem ein Agent durch Interaktion mit einer unbekannten dynamischen Umgebung lernt, eine Aufgabe zu erfüllen. Während des Trainings aktualisiert der Lernalgorithmus die Parameter der Agentenstrategie. Das Ziel des Lernalgorithmus ist es, eine optimale Strategie oder Richtlinie (policy) zu finden, die die langfristige Belohnung während der Aufgabe maximiert.
Je nach Art des Agenten wird die Strategie durch eine oder mehrere Repräsentationen von Strategie und Wertfunktionen dargestellt. Sie können diese Darstellungen mithilfe von tiefen neuronalen Netzen implementieren. Sie können diese Netze dann mithilfe der Software aus der Reinforcement Learning Toolbox™ trainieren.
Weitere Informationen finden Sie unter .