4

画像からロゴを識別するプロジェクトがあります。最初は Haar 分類器を使用していましたが、Haar 分類器のトレーニングには多くの時間がかかります (Core i5 マシンでは、ロゴごとに 4 日かかります)。300 以上のロゴをトレーニングするには、かなりの時間がかかります (高性能コンピューターはありません)。そのため、トレーニングにかかる​​時間が大幅に短縮されることを期待して、HOG ベースのオブジェクト検出器に移行することにしました。

HOG記述子のトレーニングにかかる​​時間は誰にも分かりますか? ロゴごとに約 100 のポジティブおよび 100 のネガティブ 600x800 ピクセル イメージでトレーニングします (Core i5 プロセッサを搭載したマシン上)。

4

3 に答える 3

3

答えられません。ビンの数やその他の実装の詳細によって異なります。おそらく画像の内容にも。ただし、60k の画像で超高速になるとは思わないでください。私があなただったら、画像を縮小することを真剣に検討します.600x800は、認識に必要なものよりもはるかに大きいです. 150x200 でも認識できるはずですが、すべての計算は 16 倍速くなります。

于 2012-06-08T08:32:56.457 に答える
1

入力画像を確実にダウンスケールする必要があります。たとえば、HOG 記述子は通常、64x128 の歩行者画像から抽出され、正確な歩行者検出器をトレーニングします。Haar 分類器のトレーニングには常に時間がかかり、特定のステージでブロックされる可能性があるため、所要時間を予測することは困難です。

于 2012-06-08T09:16:14.380 に答える
0

具体的な数値を示すことは困難ですが、HOG を使用したトレーニングは、Haar のような機能を使用したトレーニングよりも桁違いに高速です。また、HOG はメモリの使用量もはるかに少なくなります。trainCascadeObjectDetectorさらに、OpenCV とMATLABの関数の両方で、LBP 機能を使用するオプションがあります。LBP を使用すると、Haar を使用するよりもはるかに高速です。

于 2013-11-16T15:30:09.437 に答える