一般的な squares.cpp の例を実行しようとしています: https://github.com/Itseez/opencv/blob/master/samples/ocl/squares.cpp
/opt/AMDAPP に正しい OpenCL ライブラリがインストールされた AMD Radeon HD 6750M と、CL ライブラリを適切に検出する CMake コンパイル済み OpenCV2.4 を搭載した Macbook Pro があります。さらに、独自のドライバーを利用するために fglrx-updates を使用しています。ただし、パフォーマンスは CPP ランタイムのほぼ 2 倍悪いようです。〜200回繰り返してみましたが、同じ問題がありました。
ビルド: g++ -o square.out square.cpp -L/usr/local/lib -L/opt/AMDAPP/lib -I/usr/local/include -I/opt/AMDAPP/include -lopencv_core -lopencv_highgui -lopencv_ocl -lopencv_gpu -lopencv_imgproc -lOpenCL
結果:
cpp 平均時間: 233.192ms
ocl 平均時間: 568.043ms