photo


Last seen: 1 year 前 自 2022 起处于活动状态

Followers: 0   Following: 0

统计学

  • First Answer

查看徽章

Feeds

排序方式:

提问


使用PPO和TRPO算法在reinforcement learning design app输出连续动作时,动作值不在设定好的区间内
%Open model mdl='FCEV'; blk='FCEV/RL Agent'; %open_system(mdl); %(s,a) obsInfo = rlNumericSpec([3 1]); obsInfo.Name = ...

2 years 前 | 1 个回答 | 1

1

个回答