強化学習の学習済み方策の転移について

2 次查看(过去 30 天)
一馬 平田
一馬 平田 2021-8-1
お世話になります。
強化学習(DQN)の学習済み方策を別の制御モデルに転移させる時、学習済みのQ-Networkを転移させることは可能でしょうか。
また、転移学習の例題では最終層以外の層の学習率を0にすることで最終層以外の重みを凍結させていましたが、一部の層の重みのみを凍結することは可能でしょうか。

采纳的回答

Hiro Yoshino
Hiro Yoshino 2021-8-2
やったことが無いのですが、可能だと思います。
DQN なので、rlQValueRepresentation で学習済みのネットワークを渡せば良いと思います。
また、学習済みのネットワークを追加で学習する際に、一部のレイヤーの一部のパラメータの学習率をコントロールすることが任意で可能です。setLearnRateFactor で 任意のパラメータの学習係数を指定できます。
これにグローバルの学習率が掛け合わさって、そのパラメータの学習率になります。従って、これを使ってゼロを設定すれば、そのパラメータは学習において更新されません。

更多回答(0 个)

类别

Help CenterFile Exchange 中查找有关 時系列、シーケンス、およびテキストを使用した深層学習 的更多信息

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!