opencv 顔検出器を使用して多視点顔検出コードを作成しました。画像に対して 5 つの検出器 (さまざまなポーズ角度用にトレーニング済み) を実行し、それらの重みを使用して画像内の顔を検出しています。TBB parallel_for を使用してコードを並列化しましたが、パフォーマンスはわずか 1.7 倍向上しました。5 つの検出器を並行して実行するためのより良い方法はありますか?
16 コアのクラスターでコードを実行しています。スレッドの数 (私の場合は 5) が少なすぎて、完全なパワーを利用できないと思います。
助言がありますか?
ありがとう、