Reinforcement Learning Toolbox

Entwurf und Training von Strategien (Policies) mithilfe von Reinforcement Learning

Haben Sie Fragen? Vertrieb kontaktieren.

Die Reinforcement Learning Toolbox bietet eine App, Funktionen und einen Simulink®- Block zum Trainieren von Strategien mit Reinforcement-Learning-Algorithmen wie DQN, PPO, SAC und DDPG. Mithilfe dieser Strategien können Sie Steuerungen und Entscheidungsalgorithmen für komplexe Anwendungen wie Ressourcenzuweisung, Robotik und autonome Anlagen implementieren.

Die Toolbox ermöglicht das Darstellen von Strategien und Wertefunktionen mithilfe tiefer neuronaler Netze oder Lookup-Tabellen und ihr Trainieren durch die Interaktion mit Umgebungen, die als MATLAB- oder Simulink-Modelle dargestellt werden. Sie haben die Möglichkeit, die in der Toolbox bereitgestellten Single-Agent- oder Multi-Agent-Reinforcement-Learning-Algorithmen zu evaluieren oder eigene zu erstellen. Sie können mit Hyperparameter-Einstellungen experimentieren, den Trainingsfortschritt überwachen und trainierte Agenten entweder interaktiv durch die App oder per Programm simulieren. Um die Trainingsleistung zu optimieren, können Sie parallele Simulationen auf mehreren CPUs, Grafikkarten, in Computer-Clustern sowie in der Cloud (mit der Parallel Computing Toolbox und MATLAB Parallel Server) ausführen.

Durch das ONNX™-Modellformat lassen sich zudem vorhandene Strategien aus Deep-Learning-Frameworks wie TensorFlow™ Keras und PyTorch (mit der Deep Learning Toolbox) importieren. Sie können optimierten C, C++ und CUDA^®-Code generieren, um trainierte Strategien auf Microcontrollern und GPUs anzuwenden. Die Toolbox beinhaltet Referenzbeispiele, um Ihnen die ersten Schritte zu erleichtern.

Einführung in Reinforcement Learning Toolbox

Entdecken Sie die neuesten Features in den Versionshinweisen

Reinforcement-Learning-Agenten

Erstellen Sie modellfreie sowie modellbasierte Reinforcement-Learning-Agenten mithilfe beliebter Algorithmen wie DQN, PPO und SAC. Alternativ können Sie mit den bereitgestellten Vorlagen auch eigene Algorithmen entwickeln. Mit dem RL Agent-Block führen Sie Ihre Agenten in Simulink ein.

Policies und Learning-Algorithmen | Reinforcement Learning, Teil 3 (17:51)

Dokumentation

Reinforcement Learning Designer-App

Entwerfen, trainieren und simulieren Sie interaktiv Reinforcement-Learning-Agenten. Exportieren Sie trainierte Agents in MATLAB zur weiteren Verwendung und Bereitstellung.

Dokumentation | Beispiel

Belohnungssignale

Erstellen Sie Belohnungssignale, die messen, wie erfolgreich der Agent bei der Zielerreichung ist. Generieren Sie Belohnungsfunktionen automatisch aus Regelungsspezifikationen, die in der Model Predictive Control Toolbox oder in Simulink Design Optimization definiert sind.

Dokumentation

Policy-Darstellung

Mithilfe der von der Toolbox vorgeschlagenen neuronalen Netzarchitekturen können Sie in wenigen Minuten loslegen. Alternativ können Sie mit Ebenen der Deep Learning Toolbox und der Deep Network Designer-App manuell Lookup-Tabellen erkunden oder Strategiefunktionen für neuronale Netze definieren.

Dokumentation

Reinforcement-Learning-Training

Trainieren Sie Agenten durch Interaktionen mit einer Umgebung oder mithilfe vorhandener Daten. Erkunden Sie das Trainieren eines einzelnen oder mehrerer Agenten. Protokollieren und visualisieren Sie Trainingsdaten und verfolgen Sie dabei Ihren Fortschritt mit.

Eine Einführung in das Multi-Agent Reinforcement Learning (14:43)

Dokumentation | Beispiel

Verteiltes Rechnen

Beschleunigen Sie das Training mit Mehrkerncomputern, Cloud-Ressourcen oder Computerclustern mithilfe der Parallel Computing Toolbox und MATLAB Parallel Server. Nutzen Sie Grafikkarten, um Vorgänge wie Gradientenberechnung und -vorhersage zu beschleunigen.

Dokumentation | Beispiel

Screenshot eines Simulink-Modells für einen vierbeinigen Roboter.

Umgebungsmodellierung

Modellieren Sie Umgebungen, die nahtlos mit den Reinforcement-Learning-Agenten mithilfe von MATLAB und Simulink interagieren. Erstellen Sie Schnittstellen zu Modellierungstools Dritter.

Erste Schritte mit Reinforcement Learning (9:30)

Codegenerierung und -bereitstellung

Generieren Sie automatisch C/C++ und CUDA Code aus trainierten Strategien zur Bereitstellung auf Embedded-Geräten. Mit MATLAB Compiler und MATLAB Production Server können Sie trainierte Strategien in Produktionssystemen als eigenständig ausführbare Anwendungen, gemeinsam genutzte C/C++ Bibliotheken und mehr bereitstellen.

Dokumentation | Beispiel

Referenzbeispiele

Entwerfen Sie Steuerungen Entscheidungsalgorithmen für Roboter, selbstfahrende Fahrzeuge, Kalibrierungen, Zeitplanung und andere Anwendungen. Unsere Referenzbeispiele helfen Ihnen bei den ersten Schritten.

Beispiele

Produktressourcen:

Dokumentation Beispiele Videos Technische Artikel Funktionen Blöcke Anforderungen Versionshinweise

„5G ist eine entscheidende Infrastruktur, die wir vor schädlichen Angriffen schützen müssen. Mit der Reinforcement Learning Toolbox können wir die 5G-Schwachstellen innerhalb kürzester Zeit abschätzen und entsprechende Abwehrmethoden ermitteln.“
Ambrose Kam, Lockheed Martin

Weitere Berichte von Anwendern ansehen