3

分類プロセスを少し速くしようとしています。deploy.prototxt の最初の input_dim を増やすことを考えましたが、うまくいかないようです。各画像を 1 つずつ分類するよりも少し遅くなります。

deploy.prototxt

input: "data"  
input_dim: 128  
input_dim: 1  
input_dim: 120  
input_dim: 160  
... net description ...

pythonネットの初期化

net=caffe.Net( 'deploy.prototxt', 'model.caffemodel', caffe.TEST)
net.blobs['data'].reshape(128, 1, 120, 160)
transformer = caffe.io.Transformer({'data':net.blobs['data'].data.shape})
#transformer settings

パイソン分類

images=[None]*128
for i in range(len(images)):
  images[i]=caffe.io.load_image('image_path', False)
for j in range(len(images)):
  net.blobs['data'].data[j,:,:,:] = transformer.preprocess('data',images[j])
out = net.forward()['prob']

詳細は省きましたが、重要なことは説明する必要があります。32、64、...、1024 など、さまざまなバッチ サイズを試しましたが、すべてほぼ同じでした。だから私の質問は、誰かが私が間違っていること、または何を変更する必要があるかを知っているかどうかです。手伝ってくれてありがとう!

編集:
いくつかのタイミング結果、平均時間は、処理された画像 (1044) で割った合計時間です。

バッチサイズ: 1

2016-05-04 10:51:20,721 - 検出器 - 情報 - データ形状: (1, 1, 120, 160)
2016-05-04 10:51:35,149 -メイン- 情報 - GPU タイミング:
2016-05-04 10:51:35,149 -メイン- 情報 - 処理された画像: 1044
2016-05-04 10:51:35,149 -メイン- 情報 - 合計時間: 14.43 秒
2016-05-04 10:51:35,149 -メイン- 情報 -平均時間: 13.82ms
2016-05-04 10:51:35,149 -メイン- 情報 - ロード時間: 8.31 秒
2016-05-04 10:51:35,149 -メイン- 情報 - 平均ロード時間: 7.96ms
2016-05-04 10:51:35,149 -メイン- 情報 - 分類時間: 5.99 秒
2016-05-04 10:51:35,149 -メイン- 情報 - 平均分類時間: 5.74ms

バッチサイズ: 32

2016-05-04 10:52:30,773 - 検出器 - 情報 - データ形状: (32, 1, 120, 160)
2016-05-04 10:52:45,135 -メイン- 情報 - GPU タイミング:
2016-05-04 10:52:45,135 -メイン- 情報 - 処理された画像: 1044
2016-05-04 10:52:45,135 -メイン- 情報 - 合計時間: 14.36 秒
2016-05-04 10:52:45,136 -メイン- 情報 -平均時間: 13.76ms
2016-05-04 10:52:45,136 -メイン- 情報 - ロード時間: 7.13 秒
2016-05-04 10:52:45,136 -メイン- 情報 - 平均ロード時間: 6.83ms
2016-05-04 10:52:45,136 -メイン- 情報 - 分類時間: 7.13 秒
2016-05-04 10:52:45,136 -メイン- 情報 - 平均分類時間: 6.83ms

バッチサイズ: 128

2016-05-04 10:53:17,478 - 検出器 - 情報 - データ形状: (128, 1, 120, 160)
2016-05-04 10:53:31,299 -メイン- 情報 - GPU タイミング:
2016-05-04 10:53:31,299 -メイン- 情報 - 処理された画像: 1044
2016-05-04 10:53:31,299 -メイン- 情報 - 合計時間: 13.82 秒
2016-05-04 10:53:31,299 -メイン- 情報 -平均時間: 13.24ms
2016-05-04 10:53:31,299 -メイン- 情報 - ロード時間: 7.06 秒
2016-05-04 10:53:31,299 -メイン- 情報 - 平均ロード時間: 6.77ms
2016-05-04 10:53:31,299 -メイン- 情報 - 分類時間: 6.66 秒
2016-05-04 10:53:31,299 -メイン- 情報 - 平均分類時間: 6.38ms

バッチサイズ: 1024

2016-05-04 10:54:11,546 - 検出器 - 情報 - データ形状: (1024, 1, 120, 160)
2016-05-04 10:54:25,316 -メイン- 情報 - GPU タイミング:
2016-05-04 10:54:25,316 -メイン- 情報 - 処理された画像: 1044
2016-05-04 10:54:25,316 -メイン- 情報 - 合計時間: 13.77 秒
2016-05-04 10:54:25,316 -メイン- 情報 -平均時間: 13.19ms
2016-05-04 10:54:25,316 -メイン- 情報 - ロード時間: 7.04 秒
2016-05-04 10:54:25,316 -メイン- 情報 - 平均ロード時間: 6.75ms
2016-05-04 10:54:25,316 -メイン- 情報 - 分類時間: 6.63 秒
2016-05-04 10:54:25,316 -メイン- 情報 - 平均分類時間: 6.35ms

4

1 に答える 1