私は DLIB のオブジェクト検出の例を使用しており、ボトルの 14 の画像を含む 7 つの画像を使用してトレーニングしようとしています。これらの画像は主に約 200x300 ピクセルですが、2 つははるかに大きくなっています (1500x2000 ピクセル領域)。大きな画像にはそれぞれ 1 つの例しか含まれていません。画像は非常に大きいですが、ボトル自体は小さなトレーニング画像のボトルとほぼ同じサイズです。私のスライディング ウィンドウは 70x240 で、これは私が描いたバウンディング ボックスの平均サイズです。
現在、Windows 8 64 ビットを実行する 384 GB の RAM を搭載した Windows Server マシンで、目的関数を 8 時間以上最小化しています。こんなに時間がかかるなんてありえない。それはまだ進行中です。反復 125 です...
ドキュメントには、提供された一連の顔に対して「10 秒程度」で顔検出器をトレーニングすることが記載されています。デバッガーに渡された引数を使用して MS Visual Studio 2012 で実行しているためでしょうか? 顔検出器の例を実行したときでさえ、トレーニングに 30 ~ 45 分かかりました。10 秒をはるかに超えています。
誰かが同様の問題を抱えていて、それを修正する方法を知っていますか?
ご協力いただきありがとうございます!