なぜ、Deep Learning Toolbox において大規模な検証データを設定しているとメモリエラーになりますか？

Question

MathWorks Support Team 2020-8-31

0
链接

此问题的直接链接

https://ww2.mathworks.cn/matlabcentral/answers/586715-deep-learning-toolbox

回答： MathWorks Support Team 2020-8-31

采纳的回答： MathWorks Support Team

学習画像数が 1,580,470枚、クラス数は81,313 種類となるような大規模な分類ネットワークを学習しようとしています。

メモリエラーを回避するために、trainingOptions 側で学習における MiniBatchSize を十分に小さく(例えば、MiniBatchSize = 1) 設定した場合でも、学習時にメモリエラーで停止します。

※ 検証データ数は、全データの30%にあたる 474,141 枚に設定しています。

下記はエラーメッセージとなります。

Starting parallel pool (parpool) using the 'local' profile ...

Connected to the parallel pool (number of workers: 2).

Initializing input data normalization.

======================================================================================================================

======================================================================================================================

Error using trainNetwork (line 170)

Out of memory.

Error in overall (line 97)

net = trainNetwork(trDsAug, lgraph, options);

Caused by:

Error using nnet.internal.cnn.ParallelTrainer/train (line 96)

Error detected on worker 1.

Error using nnet.internal.cnn.util.aggregateArrayFromObservations (line

12)

Out of memory.

请先登录，再回答此问题。

Answer 1

MathWorks Support Team 2020-8-31

0
链接

此回答的直接链接

https://ww2.mathworks.cn/matlabcentral/answers/586715-deep-learning-toolbox#answer_487322

このエラーは、全ての検証データセットに対して、 CPU上において単一の配列を生成する過程で発生します。

本例では、 474171 枚が検証用データとなります。

また、クラス数が 81,313種類となるため、内部で作成される単一の配列サイズが

[1 1 1 numberOfClasses numberOfValidationPoints] = [1 1 1 474141 81313] で

約 143GB の連続メモリ領域が必要となります。

また、この操作を実行する際に配列サイズ分のコピーを行う過程があるため、少なくともその倍のメモリが必要になります。

検証用のデータセットが巨大かつ識別クラス数の場合 (それを乗算する配列数が必要)に生じることになるため、検証用のデータ数を減らす方向で対応をお願いします。

0 个评论
显示 -2更早的评论隐藏 -2更早的评论

请先登录，再进行评论。

なぜ、Deep Learning Toolbox において大規模な検証データを設定しているとメモリエラーになりますか？

采纳的回答

0 个评论
显示 -2更早的评论隐藏 -2更早的评论

更多回答（0 个）

另请参阅

类别

标签

Community Treasure Hunt

なぜ、Deep Learning Toolbox において大規模な検証​データを設定している​とメモリエラーになり​ますか？

采纳的回答

0 个评论 显示 -2更早的评论隐藏 -2更早的评论

更多回答（0 个）

另请参阅

类别

标签

Community Treasure Hunt

なぜ、Deep Learning Toolbox において大規模な検証データを設定しているとメモリエラーになりますか？

0 个评论
显示 -2更早的评论隐藏 -2更早的评论