フィルターする画像スタックをn
持つ h5 ファイルを含むディレクトリがあります。m
画像ごとに、dask
並列配列を使用してフィルタリング (ガウスおよびラプラシアン) を実行し、処理を高速化します ( Ref to Dask )。apply_parallel()
scikit-imageの関数で dask 配列を使用します 。
を使用して小さなサーバーで処理を実行します20 cpus
。
どの並列戦略を使用するのがより理にかなっているのか、アドバイスをもらいたいです。
1) h5 ファイルの順次処理と dask 処理用のすべての cpu
2) h5 ファイルの並列処理をx
コアで実行し、残り20-x
を dask 処理に使用します。
3) リソースを分散し、h5 ファイル、各 h5 ファイル内の画像、および dask の残りのリソースを並列処理します。
助けてくれてありがとう!