The definition of the Target update frequency in Reinforcement Learning Designer.

Question

Xian Zheng Hong am 7 Mär. 2024

0
Verknüpfen

Direkter Link zu dieser Frage

https://de.mathworks.com/matlabcentral/answers/2091631-the-definition-of-the-target-update-frequency-in-reinforcement-learning-designer

Kommentiert: Xian Zheng Hong am 16 Mär. 2024

Akzeptierte Antwort: UDAYA PEDDIRAJU

In DDPG Agent, there are four networks. Online policy, Target policy, Online Q and Target Q.

The [Target update frequency] is used to the Target policy and Target Q in Reinforcement Learning Designer.

Are the Update frequency of the Online policy and Online Q same as the [Target update frequency] ?

0 Kommentare
-2 ältere Kommentare anzeigen-2 ältere Kommentare ausblenden

Melden Sie sich an, um zu kommentieren.

Melden Sie sich an, um diese Frage zu beantworten.

Answer 1

UDAYA PEDDIRAJU am 12 Mär. 2024

1
Verknüpfen

Direkter Link zu dieser Antwort

https://de.mathworks.com/matlabcentral/answers/2091631-the-definition-of-the-target-update-frequency-in-reinforcement-learning-designer#answer_1424086

Hi Xian,

No, the update frequency of the Online Policy and Online Q networks is not the same as the Target Update Frequency. The Target Update Frequency specifically applies to how often the Target Policy and Target Q networks are updated, which is typically less frequent or managed differently to ensure stability in learning.

1 Kommentar
-1 ältere Kommentare anzeigen-1 ältere Kommentare ausblenden

Xian Zheng Hong am 16 Mär. 2024

Thanks for answering. Here is my another question.

Are the Online policy and Online Q updated at every time step in Reinforcement Learning Designer Toolbox?

Melden Sie sich an, um zu kommentieren.

The definition of the Target update frequency in Reinforcement Learning Designer.

0 Kommentare
-2 ältere Kommentare anzeigen-2 ältere Kommentare ausblenden

Akzeptierte Antwort

1 Kommentar
-1 ältere Kommentare anzeigen-1 ältere Kommentare ausblenden

Weitere Antworten (0)

Siehe auch

Kategorien

Tags

Community Treasure Hunt

The definition of the Target update frequency in Reinforcement Learning Designer.

0 Kommentare -2 ältere Kommentare anzeigen-2 ältere Kommentare ausblenden

Akzeptierte Antwort

1 Kommentar -1 ältere Kommentare anzeigen-1 ältere Kommentare ausblenden

Weitere Antworten (0)

Siehe auch

Kategorien

Tags

Community Treasure Hunt

0 Kommentare
-2 ältere Kommentare anzeigen-2 ältere Kommentare ausblenden

1 Kommentar
-1 ältere Kommentare anzeigen-1 ältere Kommentare ausblenden