CNNとRCNNの違いと、最適な使用方法について
6 次查看(过去 30 天)
显示 更早的评论
こんにちは。
画像認識において、一枚の画像に複数の物体が写っている場合、例えば犬と猫と鳥が写っている場合、CNNですとその写真が「犬と猫と鳥が写っている」と判断するのに対して、RCNN(YOLOとか)は「ここに犬がいてここに猫がいてここに鳥が写っている」と判断すると思うのですが、このように複数の物体がある画像を複数同時に分類する場合は、RCNNのような物体検出ができるネットワークを使用するのが良いのでしょうか。
CNNですと画像全体の特徴から分類すると思うので、1つの物体を認識するのには向いているように感じます。RCNNなら画像全体の特徴から場所を特定してそれが何であるのか判断すると思うので、部分的に認識できていると理解しています。ですが、RCNNは単に物体の位置だけを判断しているだけで、その物体が何なのかを判断するのは画像全体の特徴を使用したCNNによるものだとすれば、位置はとくに気にしない複数の物体が写った画像認識は、すべてCNNを使用したほうが良いのでしょうか。
わかりずらい質問となっていしまい申し訳ありませんが、よろしくお願いいたします。
0 个评论
采纳的回答
Kenta
2020-12-5
こんにちは、はい、おおむねおっしゃる通りと思います。
>位置はとくに気にしない複数の物体が写った画像認識は、すべてCNNを使用したほうが良いのでしょうか
はい、その画像自体がどういうカテゴリーになるかだと、CNNによる分類でよいと思います。ただ、その画像に猫と犬の両方が映っていたりしていないか注意する必要がありますね。
3 个评论
Kenta
2020-12-5
そうですね、猫と犬が両方映っていると、その画像はどのカテゴリが何に属すかCNNでは判別できなくなってしまいます。R-CNNやYOLO, SSDなどでは物体の位置を知りたいときに使います。例えば人がどの位置にいて、間隔を取って並んでいるか、とか、人の顔を検出して、熱情報のとれるカメラから体温を予測する、などですかね。このようなタスクだと分類だけではうまく行かないと思います。物体検出、などでキーワード検索したらいろいろと応用事例が出てくるのでまた見てみてください
更多回答(0 个)
另请参阅
Community Treasure Hunt
Find the treasures in MATLAB Central and discover how the community can help you!
Start Hunting!