上記リンクのなかでは、いくつかのものからひとつを見つける下記のサンプルが合うかと思います。
Create a network for multiclass R-CNN object detection
学習には正解のラベル付けをした画像のデータセットで学習させる必要がありますが、Training Image Labelerのアプリを使うとよいです。 http://jp.mathworks.com/help/vision/ref/trainingimagelabeler-app.html
ディープラーニング自体がこれからでしたら、使い方や手元の画像でどの程度の認識率になるかCNNの転移学習からはじめてみるといいかもしれません。