強化学習におけるrlTrainingOptionsについての質問
显示 更早的评论
現在DQNを構築し、
他のソフトを環境として強化学習を実行しています。
環境側で1エピソード分の作業が終了した後、
次のエピソードが始まるまでに15秒ほど時間がかかるのですが、
その間にmatlab側では100エピソードほど進んでしまいます。
そこで、
rlTrainingOptionsなどを用いて1エピソード目の評価を行ったあとに15秒待機する、
といったような設定を行うことは可能でしょうか。
4 个评论
Toshinobu Shintai
2020-12-3
MATLAB, Simulinkと「他のソフト」を連携して動かす際に、どのようにして連携しているのでしょうか。その連携手法に、計算時間を同期させて動かすモードがあれば、それで問題無いように思えますが。
仰っている、時間で待機して同期させるやり方は、何かのタイミングで同期がずれる可能性があり、再現性が良くないと思います。
Y. M
2020-12-3
Y. M
2020-12-4
回答(0 个)
类别
在 帮助中心 和 File Exchange 中查找有关 Reinforcement Learning 的更多信息
Community Treasure Hunt
Find the treasures in MATLAB Central and discover how the community can help you!
Start Hunting!