trainNetwork の response を見ると、イメージ回帰の response として h x w x d x c x N の 数値配列を指定することが可能なようです。
>以下のMATLABの例を用いて、[images, digits, angles]の要素のanglesを画像の配列に置き換えたところ、学習させる際に「無効な学習データです」と出てしまいました。
angles の出力と画像の出力サイズが異なると思いますが、ネットワークの出力は変更されましたか?
のやり方が参考になると思います。
また、こちらを見ると 分かる通り、combine をすると最後の datastore が応答になりますので、応答用の画像の datastore を準備してインプット画像と combine されると良いかと思います。