CNNとRCNNの違いと、最適な使用方法について

Question

0 个投票

こんにちは。

画像認識において、一枚の画像に複数の物体が写っている場合、例えば犬と猫と鳥が写っている場合、CNNですとその写真が「犬と猫と鳥が写っている」と判断するのに対して、RCNN(YOLOとか)は「ここに犬がいてここに猫がいてここに鳥が写っている」と判断すると思うのですが、このように複数の物体がある画像を複数同時に分類する場合は、RCNNのような物体検出ができるネットワークを使用するのが良いのでしょうか。

CNNですと画像全体の特徴から分類すると思うので、１つの物体を認識するのには向いているように感じます。RCNNなら画像全体の特徴から場所を特定してそれが何であるのか判断すると思うので、部分的に認識できていると理解しています。ですが、RCNNは単に物体の位置だけを判断しているだけで、その物体が何なのかを判断するのは画像全体の特徴を使用したCNNによるものだとすれば、位置はとくに気にしない複数の物体が写った画像認識は、すべてCNNを使用したほうが良いのでしょうか。

わかりずらい質問となっていしまい申し訳ありませんが、よろしくお願いいたします。

0 个评论
显示 -2更早的评论隐藏 -2更早的评论

请先登录，再进行评论。

请先登录，再回答此问题。

请先登录再关注

Answer 1

Kenta 2020-12-5

0 个投票

こんにちは、はい、おおむねおっしゃる通りと思います。

>位置はとくに気にしない複数の物体が写った画像認識は、すべてCNNを使用したほうが良いのでしょうか

はい、その画像自体がどういうカテゴリーになるかだと、CNNによる分類でよいと思います。ただ、その画像に猫と犬の両方が映っていたりしていないか注意する必要がありますね。

3 个评论
显示 1更早的评论隐藏 1更早的评论

Kenta 2020-12-5

そうですね、猫と犬が両方映っていると、その画像はどのカテゴリが何に属すかCNNでは判別できなくなってしまいます。R-CNNやYOLO, SSDなどでは物体の位置を知りたいときに使います。例えば人がどの位置にいて、間隔を取って並んでいるか、とか、人の顔を検出して、熱情報のとれるカメラから体温を予測する、などですかね。このようなタスクだと分類だけではうまく行かないと思います。物体検出、などでキーワード検索したらいろいろと応用事例が出てくるのでまた見てみてください

HY 2020-12-5

なるほど… CNNだとカテゴリが複数の場合は、うまく機能しないと言うことですね。詳しく教えてくださりありがとうございます！ RCNNについても色々と調べてみます！

请先登录，再进行评论。

CNNとRCNNの違いと、最適な使用方法について

0 个评论
显示 -2更早的评论隐藏 -2更早的评论

采纳的回答

3 个评论
显示 1更早的评论隐藏 1更早的评论

更多回答（0 个）

类别

标签

Community Treasure Hunt

CNNとRCNNの違いと、最適な使用方法について

0 个评论 显示 -2更早的评论 隐藏 -2更早的评论

采纳的回答

3 个评论 显示 1更早的评论 隐藏 1更早的评论

更多回答（0 个）

类别

标签

另请参阅

Community Treasure Hunt

0 个评论
显示 -2更早的评论隐藏 -2更早的评论

3 个评论
显示 1更早的评论隐藏 1更早的评论