並列化を使用してpymc3サンプリングを高速化しようとしていますが、わずかなメリットしかありません。
i7 MacBook Pro では、総実行時間を 25 分 (njobs=1) から 13 分 (njobs=6) に短縮できました。pymc が実際にサンプリングを開始するまでに約 4 分かかるため、増加は比較的小さいです。
問題は、pymc3 で GPU を使用して成功した人はいますか? また、サンプリングに 6 ~ 8 分かかるモデルでどれだけのメリットが得られるでしょうか? (私の MacBook には nvidia GT 750M 2Gb が搭載されています)