ワークスペースのデー​タを1ステップごとに​受け渡す方法(強化学​習)

1 次查看(过去 30 天)
拓生 香山
拓生 香山 2021-10-28
いつもお世話になっております。
以前、回帰学習器で作成した予測モデルを環境として,Simulinkを用いて強化学習を行おうとしています。
予測モデル(環境)の入力:
強化学習の行動 action
外乱(ワークスペースにある気象庁のデータ)4項目
予測値(前ステップの出力値)T_wall
出力:次のステップの状態値 T_outlet , H_outlet , T_wall
※T_wall は前ステップの予測値を次ステップの入力に用いる としています。
質問としては1ステップごとにワークスペース内の外乱(行列データ)を1行ずつ読み込みたいのですが、可能でしょうか。
(例えば1エピソード目は1行目のデータ、2ステップ目は2行目のデータなど)
もし可能であれば、データの読み込み方、またそのステップの行動と全ステップの予測値一つの行列にまとめて予測モデル (環境)に受け渡すにはどうすればよいかご教授頂きたいです。
わかる方いらっしゃれば回答いただけると幸いです。 よろしくお願いいたします。

回答(0 个)

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!