photo

泽宇


Last seen: 1 year 前 自 2024 起处于活动状态

Followers: 0   Following: 0

统计学

MATLAB Answers

2 个提问
0 个回答

排名
296,793
of 300,988

声誉
0

贡献数
2 个提问
0 个回答

回答接受率
0.0%

收到投票数
0

排名
 of 21,130

声誉
N/A

平均
0.00

贡献数
0 文件

下载次数
0

ALL TIME 下载次数
0

排名

of 172,218

贡献数
0 个问题
0 个答案

评分
0

徽章数量
0

贡献数
0 帖子

贡献数
0 公开的 个频道

平均

贡献数
0 个亮点

平均赞数

Feeds

排序方式:

提问


When using the reinforcement learning toolbox, when training the agent, there will be a problem that action is the boundary.
我在用深matlab强化学习工具箱进行自定义环境智能体训练,在第一次训练时(未得到奖励时),智能体给出的action是action约束范围内的值,然而在第二次训练时(得到第一次训练的奖励后),智能体给出的action是action却是约束范围的边界值?并且...

2 years 前 | 0 个回答 | 0

0

个回答

提问


TD3算法训练时动作总是输出边界值
我在使用TD3算法训练完成后,无论训练过程中奖励曲线是否收敛,动作总是输出边界值或者输出完全不正确。我的state的值在0-20000,动作边界在0-15000.是哪里出了问题,是自定义环境创建的不正确还是哪里?需要对输入输出进行归一化吗

2 years 前 | 1 个回答 | 0

1

个回答