分類プロセスを少し速くしようとしています。deploy.prototxt の最初の input_dim を増やすことを考えましたが、うまくいかないようです。各画像を 1 つずつ分類するよりも少し遅くなります。
deploy.prototxt
input: "data"
input_dim: 128
input_dim: 1
input_dim: 120
input_dim: 160
... net description ...
pythonネットの初期化
net=caffe.Net( 'deploy.prototxt', 'model.caffemodel', caffe.TEST)
net.blobs['data'].reshape(128, 1, 120, 160)
transformer = caffe.io.Transformer({'data':net.blobs['data'].data.shape})
#transformer settings
パイソン分類
images=[None]*128
for i in range(len(images)):
images[i]=caffe.io.load_image('image_path', False)
for j in range(len(images)):
net.blobs['data'].data[j,:,:,:] = transformer.preprocess('data',images[j])
out = net.forward()['prob']
詳細は省きましたが、重要なことは説明する必要があります。32、64、...、1024 など、さまざまなバッチ サイズを試しましたが、すべてほぼ同じでした。だから私の質問は、誰かが私が間違っていること、または何を変更する必要があるかを知っているかどうかです。手伝ってくれてありがとう!
編集:
いくつかのタイミング結果、平均時間は、処理された画像 (1044) で割った合計時間です。
バッチサイズ: 1
2016-05-04 10:51:20,721 - 検出器 - 情報 - データ形状: (1, 1, 120, 160)
2016-05-04 10:51:35,149 -メイン- 情報 - GPU タイミング:
2016-05-04 10:51:35,149 -メイン- 情報 - 処理された画像: 1044
2016-05-04 10:51:35,149 -メイン- 情報 - 合計時間: 14.43 秒
2016-05-04 10:51:35,149 -メイン- 情報 -平均時間: 13.82ms
2016-05-04 10:51:35,149 -メイン- 情報 - ロード時間: 8.31 秒
2016-05-04 10:51:35,149 -メイン- 情報 - 平均ロード時間: 7.96ms
2016-05-04 10:51:35,149 -メイン- 情報 - 分類時間: 5.99 秒
2016-05-04 10:51:35,149 -メイン- 情報 - 平均分類時間: 5.74ms
バッチサイズ: 32
2016-05-04 10:52:30,773 - 検出器 - 情報 - データ形状: (32, 1, 120, 160)
2016-05-04 10:52:45,135 -メイン- 情報 - GPU タイミング:
2016-05-04 10:52:45,135 -メイン- 情報 - 処理された画像: 1044
2016-05-04 10:52:45,135 -メイン- 情報 - 合計時間: 14.36 秒
2016-05-04 10:52:45,136 -メイン- 情報 -平均時間: 13.76ms
2016-05-04 10:52:45,136 -メイン- 情報 - ロード時間: 7.13 秒
2016-05-04 10:52:45,136 -メイン- 情報 - 平均ロード時間: 6.83ms
2016-05-04 10:52:45,136 -メイン- 情報 - 分類時間: 7.13 秒
2016-05-04 10:52:45,136 -メイン- 情報 - 平均分類時間: 6.83ms
バッチサイズ: 128
2016-05-04 10:53:17,478 - 検出器 - 情報 - データ形状: (128, 1, 120, 160)
2016-05-04 10:53:31,299 -メイン- 情報 - GPU タイミング:
2016-05-04 10:53:31,299 -メイン- 情報 - 処理された画像: 1044
2016-05-04 10:53:31,299 -メイン- 情報 - 合計時間: 13.82 秒
2016-05-04 10:53:31,299 -メイン- 情報 -平均時間: 13.24ms
2016-05-04 10:53:31,299 -メイン- 情報 - ロード時間: 7.06 秒
2016-05-04 10:53:31,299 -メイン- 情報 - 平均ロード時間: 6.77ms
2016-05-04 10:53:31,299 -メイン- 情報 - 分類時間: 6.66 秒
2016-05-04 10:53:31,299 -メイン- 情報 - 平均分類時間: 6.38ms
バッチサイズ: 1024
2016-05-04 10:54:11,546 - 検出器 - 情報 - データ形状: (1024, 1, 120, 160)
2016-05-04 10:54:25,316 -メイン- 情報 - GPU タイミング:
2016-05-04 10:54:25,316 -メイン- 情報 - 処理された画像: 1044
2016-05-04 10:54:25,316 -メイン- 情報 - 合計時間: 13.77 秒
2016-05-04 10:54:25,316 -メイン- 情報 -平均時間: 13.19ms
2016-05-04 10:54:25,316 -メイン- 情報 - ロード時間: 7.04 秒
2016-05-04 10:54:25,316 -メイン- 情報 - 平均ロード時間: 6.75ms
2016-05-04 10:54:25,316 -メイン- 情報 - 分類時間: 6.63 秒
2016-05-04 10:54:25,316 -メイン- 情報 - 平均分類時間: 6.35ms