Hauptinhalt

Die Übersetzung dieser Seite ist veraltet. Klicken Sie hier, um die neueste Version auf Englisch zu sehen.

Verstärkungslernen

Ausbildung von Agenten in tiefen neuronalen Netzen durch Interaktion mit einer unbekannten dynamischen Umgebung

Verstärkungslernen ist ein zielgerichteter Berechnungsansatz, bei dem ein Agent durch Interaktion mit einer unbekannten dynamischen Umgebung lernt, eine Aufgabe zu erfüllen. Während des Trainings aktualisiert der Lernalgorithmus die Parameter der Agentenstrategie. Das Ziel des Lernalgorithmus ist es, eine optimale Strategie oder Richtlinie (policy) zu finden, die die langfristige Belohnung während der Aufgabe maximiert.

Je nach Art des Agenten wird die Strategie durch eine oder mehrere Repräsentationen von Strategie und Wertfunktionen dargestellt. Sie können diese Darstellungen mithilfe von tiefen neuronalen Netzen implementieren. Sie können diese Netze dann mithilfe der Software aus der Reinforcement Learning Toolbox™ trainieren.

Weitere Informationen finden Sie unter .

Themen







Enthaltene Beispiele