Statistik
2 Fragen
0 Antworten
RANG
94.459
of 300.908
REPUTATION
0
BEITRÄGE
2 Fragen
0 Antworten
ANTWORTZUSTIMMUNG
0.0%
ERHALTENE STIMMEN
0
RANG
of 21.110
REPUTATION
N/A
DURCHSCHNITTLICHE BEWERTUNG
0.00
BEITRÄGE
0 Dateien
DOWNLOADS
0
ALL TIME DOWNLOADS
0
RANG
of 171.639
BEITRÄGE
0 Probleme
0 Lösungen
PUNKTESTAND
0
ANZAHL DER ABZEICHEN
0
BEITRÄGE
0 Beiträge
BEITRÄGE
0 Öffentlich Kanäle
DURCHSCHNITTLICHE BEWERTUNG
BEITRÄGE
0 Discussions
DURCHSCHNITTLICHE ANZAHL DER LIKES
Feeds
Frage
为什么智能体重复进行惩罚很大的动作,我应该如何调整我的智能体或者在simulink中进行更改?
利用ppo算法进行强化学习解决调度问题 ,智能体的动作为流速 例如假设储罐的上限为400,下限为0,已经利用Integrator模块对其进行限制上限为500,下限为-100 如图所示,蓝线和橙色的线直接超出最大值,绿线和紫线直接超出最小值 ,且其中没有...
etwa ein Jahr vor | 0 Antworten | 0
0
AntwortenFrage
matlab强化学习多维离散动作如何创建
action1_values = 0:1:40; action2_values = 0:1:40; [action1, action2] = ndgrid(action1_values, action2_values); discreteAction...
etwa ein Jahr vor | 0 Antworten | 0